Büyük ölçekli makine öğrenimi modelleri, OpenAI’nin DALL-E 2 ve Google’ın LaMDA’sı gibi manşetleri kaplayan teknolojilerin merkezinde yer alıyor. Etkileyiciler, kuşkusuz, bir insan işi olarak kabul edilebilecek kadar ikna edici görüntüler ve metinler üretebiliyorlar. Ancak modelleri geliştirmek çok fazla zaman ve hesaplama gücü gerektirdi – nakitten bahsetmiyorum bile. DALL-E 2 tek başına 2 hafta boyunca 256 GPU üzerinde eğitildi; bu, birine göre Amazon Web Services örneklerinde eğitilmişse yaklaşık 130.000 ABD Doları tutarında bir maliyete çıkıyor. tahmin etmek.

Daha küçük şirketler ayak uydurmak için mücadele ediyor, bu nedenle birçoğu, zorlu modeller oluşturma işini üstlenen ve bir API aracılığıyla bunlara erişim için ücret alan “hizmet olarak AI” satıcılarına yöneliyor. Böyle bir satıcı AssemblyAIözellikle konuşmadan metne ve metin analizi hizmetlerine odaklanan .

AssemblyAI bugün, Insight Partners’ın liderliğindeki bir B Serisi turunda 30 milyon dolar topladığını duyurdu. Y Birleştirici ve Hızlanma. Bugüne kadar, Kurucu ve CEO Dylan Fox, TechCrunch’a şirketin araştırma ve mühendislik ekiplerini ve veri merkezi kapasitesi AI model eğitimini büyütmek için yatırım yapıldığını söyleyen AssemblyAI 64 milyon dolar topladı.

Fox, iş birliği ürünleri için makine öğrenimi üzerinde çalıştığı Cisco’da 2 yıl çalıştıktan sonra AssemblyAI’yi kurdu. Bundan önce, kâr amacı gütmeyen bağışlar karşılığında müşterileri ürün teklifleriyle ödüllendirmek için şirketlerle birlikte çalışan bir kuruluş olan YouGive1’i kurdu.

Fox, TechCrunch’a bir e-posta röportajında ​​​​“Geçmiş projeler için konuşma tanıma ve doğal dil işleme (NLP) API’leri arıyordum ve 2017’de mevcut seçeneklerin ne kadar sınırlı ve düşük doğrulukta olduğunu gördükten sonra AssemblyAI’yi başlattım” dedi. “Şirketin amacı, NLP ve konuşma tanıma için son teknoloji AI modellerini araştırıp dağıtmak ve bu modelleri geliştiricilere ücretsiz ve entegre edilmesi kolay çok basit yazılım geliştirme kitleri ve API’ler içinde sunmaktır.”

AssemblyAI, otomatik transkripsiyon, konu algılama ve içerik denetimi için 80’den fazla dilde yapay zeka destekli, API tabanlı hizmetlerin yanı sıra ses ve video dosyalarını her biri için özetlerle birlikte “bölümlere” ayıran “otomatik bölümler” sunar. Geliştiriciler, platformu kullanarak, “bu konuşmadaki konuşmacıları tanımlayın” veya “bu podcast’te yasak içerik olup olmadığını kontrol edin” gibi görevleri ses-saniye başına 0,00025 dolardan başlayan nispeten düşük bir maliyetle gerçekleştirmek için çeşitli API’leri çağırabilir.

AssemblyAI

Resim Kredisi: AssemblyAI

Fox, “Milyarlarca parametreyle yüzlerce GPU üzerinde devasa AI modelleri eğitiyoruz” dedi. “Parametreler”, modellerin boyutunu ifade eder; genel olarak konuşursak, daha büyük modeller daha karmaşıktır. “Yapay zeka araştırmalarındaki gelişmelerden yararlanarak, tüm yapay zeka modellerimizin doğruluğunu önemli ölçüde artırmaya ve yenilerini piyasaya sürmeye devam ediyoruz” dedi. “Ö‘AutoTrain’ özelliğiniz, zaman içinde otomatik olarak iyileştirmek için API’nin bir müşteri verisinin rastgele bir örneğinden öğrenmesini sağlar.”

AssemblyAI, hareketli bir hizmet olarak yapay zeka sektöründeki tek oyuncu değil. NLPCloud, API’ler aracılığıyla NLP modellerini kutudan çıkarırken sağlarken, Sayso, aksanlı İngilizceyi bir aksandan diğerine neredeyse gerçek zamanlı olarak değiştirmek için bir API oluşturdu. Amazon, Google ve Microsoft’un metin analizi, görüntü tanıma, metinden konuşmaya, konuşmayı metne ve daha fazlası gibi uygulamaları hedefleyen bir dizi API tabanlı AI ürünü var.

Ancak Fox, AssemblyAI’nin hızlı bir şekilde büyümeye devam ettiğini söylüyor. pandemi ve – buna bağlı olarak – uzaktan çalışmanın yükselişi. Ses ve videonun, video konferans ve hatta flört uygulamaları gibi, giderek artan sayıda ürüne dahil edildiğini belirtiyor. bu led pekipler, ses ve video verilerinin üzerine ek, yüksek değerli özellikler oluşturmanın yollarını aramaya başlar.

“Bu özellikler, sesli yayınların içerik denetimini otomatikleştiren sosyal medya şirketlerindeki güven ve güvenlik ekiplerine veya podcast’lerde ve videolarda konuşulan konuları otomatik olarak tanımlayan reklam platformlarına, platformlarında paylaşılan video mesajları için okunabilir dökümler, özetler ve anahtar kelimeler sağlayan işbirliği araçlarına benziyor. ve telefon şirketleri, müşteri desteğini ve satış telefon görüşmelerini analiz edebilen daha akıllı çağrı merkezi platformları ve gelir istihbaratı ürünleri oluşturuyor” dedi. “AssemblyAI, bu ürün ekiplerinin yapay zeka destekli bu özellikleri ürünlerindeki ses ve video verilerinin üzerine gönderebilmesi için hızla başvurulan API platformu haline geliyor.”

Fox, AssemblyAI’nin artık 10.000’den fazla kullanıcısı arasında “yüzlerce” ödeme yapan müşteriye sahip olduğunu söylüyor. 2022’nin başından bu yana, kullanıcı tabanı 3 kat artarken, Fox’un açıklamayı reddettiği gelir 3 kat arttı.

“[We’re] Fox, her gün milyonlarca API çağrısını işliyor” dedi. “Gelecek altı ay içinde AI araştırma ekibimizi 3 katına çıkarmayı ve daha büyük ve daha karmaşık AI modellerini eğitmek için GPU donanımına milyonlarca dolar yatırım yapmayı planlıyoruz. bu zarfı zorlayacaktır. ”

Fox, büyümenin AssemblyAI’yi gelecek yıl için iyi konumlandıracağına inanıyor – ne tür rüzgarlar getirirlerse getirsinler. İşten çıkarmaların olağan hale geldiği ve finansman bulmanın zor olduğu bir zamanda, AssemblyAI’nin yıl sonuna kadar 52 kişilik ekibinin büyüklüğünü neredeyse iki katına çıkararak trendi değiştireceğini söylüyor.

“Birkaç ay önce Accel’den Şubat ayında kapattığımız ve aktif olarak bağış toplamadığımız A Serisi fonumuza zar zor dalmıştık. Ama Rebecca ile temas halindeydik. [Liu-Doyle] Bir süre Insight’tan ayrıldım ve onun gibi hissettim, Insight genel olarak artı ek sermaye, bize gerçekten yardımcı olacak [spur] büyümemizi daha da ileriye taşıyacağız” dedi Fox. “APazarın kilidi açıldıkça, hem kendimizi bu alanda baskın sağlayıcı olarak kurabilmemiz hem de müşterilerin artan beklentilerini – geliştirdikleri özellikleri ve ürünleri destekleyebilecek daha doğru AI modelleriyle destekleyebilmemiz gerekiyor.”





genel-24