Scale AI’nın 7,3 milyar dolarlık bir şirket olma yolu, görüntülerden, metinlerden, seslerden ve videolardan elde edilen gerçek verilerle döşenmiştir. Şimdi, bu temeli, AI’daki daha sıcak ve gelişmekte olan kategorilerden biri olan sentetik veri oyununa girmek için kullanıyor.

Çarşamba günü bir erken erişim programı duyurdular. Ölçek Sentetik, şirkete göre, makine öğrenimi mühendislerinin mevcut gerçek dünya veri kümelerini geliştirmek için kullanabilecekleri bir ürün. Scale, işinin bu yeni bölümünü oluşturmak için iki yönetici tuttu. Scale, daha önce Nines’ta makine öğrenimi başkanı olan ve Apple’da 3D haritalama üzerinde çalışan eski bir bilgisayarlı görü mühendisi olan Joel Kronander’ı yeni sentetik veri başkanı olarak işe aldı. Şirket ayrıca sentetik hizmetler müdürü olarak Vivek Raju Muppalla’yı işe aldı. Muppalla, daha önce Unity Technologies’de AI ve simülasyon için mühendislik direktörüydü.

Sentetik veriler göründüğü gibidir: gerçek dünyadan bilgi kullanmak yerine makine öğrenimi algoritmaları tarafından oluşturulan sahte veriler. Gizlilik en önemli konu olduğunda, tıbbi görüntüleme gibi veri oluşturmak için güçlü ve kullanışlı bir araç olabilir. Geliştiriciler, eğitim modellerine daha fazla karmaşıklık eklemek için sentetik verileri kullanabilir ve toplanan gerçek dünya veri kümelerinde sıklıkla bulunabilen önyargıların kaldırılmasına yardımcı olabilir.

Başlangıçta birleştirilmiş yazılımı, insanlar tarafından etiketlenen gerçek görüntüler, metinler, ses ve video verileriyle ölçeklendirerek, otonom araç şirketlerine, depolarda ve bilgisayarlarda kullanılan robotaksi, sürücüsüz kamyonlar ve otomatikleştirilmiş botlar geliştirmek ve dağıtmak için makine öğrenimi modellerini eğitmek için gereken etiketli verileri verin. teslimat talep edin. Başlangıç, o zamandan beri devlet, finans, e-ticaret, otonom araç ve kurumsal endüstrileri kapsayan müşterileriyle bir veri yönetimi platformu şirketine dönüştü.

Kurucu ve CEO Alexandr Wang, yeni teklifini, laboratuvarda yetiştirilen ete benzer, verilere hibrit bir yaklaşım olarak nitelendirdi.

TechCrunch’a “Tıpkı laboratuvardaki çiğ etin gerçek hayvan hücrelerinden nasıl başladığı gibi gerçek verilerle başlıyoruz ve ardından ürünü oradan büyütüp yineliyoruz ve oluşturuyoruz” dedi. Wang, sentetik veriler oluşturmak için temel olarak gerçek dünya verilerini kullanarak, müşterilere gerçekten benzersiz ve güçlü bir teklif sunabildiğini belirterek, bunun pazarda gördükleri bir boşluk olduğunu da sözlerine ekledi.

Ölçek müşterileri de bu boşluğu gördü. Wang, ürünü bir yıldan daha kısa bir süre önce geliştirmeye başladıklarını söyleyen TechCrunch’a verdiği demeçte, şirketin sentetik verilere itilmesi, müşterilerinden gelen talebe yanıt olarak geldi. Wang, otonom araç teknolojisi geliştiricisi Kodiak Robotics, Tractable AI ve ABD Savunma Bakanlığı’nın yeni sentetik veri ürünü için Scale’i kullandığını söyledi.

Bugün yaklaşık 450 çalışanı bulunan Scale, sentetik verileri 2022’de birinci öncelik ve ürün yelpazesini geliştirirken yatırım yapmaya devam edeceği bir alan olarak görüyor. Ancak bu, gerçek veri işini devralacağı anlamına gelmez. Wang, sentetik verileri, geliştiricilerin “algoritmalarından ve diğer yapay zekadan ve özellikle uç vakalarda paralarının karşılığını daha fazla almalarına” yardımcı olacak tamamlayıcı bir araç olarak görüyor.

Örneğin, otonom araç şirketleri, gerçek dünyadan senaryoları yeniden oluşturmak ve otonom sistemin bununla nasıl başa çıkacağını görmek için tekrar oynatmak için simülasyon kullanır. Ancak gerçek dünya verileri aradıkları senaryoyu sağlamayabilir.

Wang, “Gerçek dünyada, 100 bisikletçinin aynı anda karşıya geçebileceği senaryolarla çok sık karşılaşmıyorsunuz” dedi. “Gerçek dünya verilerinden başlayabiliriz ve sonra tüm bisikletlileri veya tüm insanları sentetik olarak ekleyebiliriz ve sonra bu şekilde algoritmayı düzgün bir şekilde eğitebilirsiniz.”



genel-24

Bir yanıt yazın