Yapay zeka kadar hızlı hareket eden bir sektöre ayak uydurmak zor bir iştir. Bu nedenle, bir yapay zeka sizin yerinize yapana kadar, makine öğrenimi dünyasında geçen haftaki hikayelerin yanı sıra kendi başımıza ele almadığımız önemli araştırma ve deneylerin kullanışlı bir özetini burada bulabilirsiniz.

Zaten açık değilse, AI’daki rekabet ortamı – özellikle üretken AI olarak bilinen alt alan – çok sıcak. Ve daha da sıcak oluyor. Bu hafta Dropbox, şirketin “işin geleceğini şekillendiren” yapay zeka destekli ürünler geliştiren girişimlere odaklanacağını söylediği ilk kurumsal girişim fonu Dropbox Ventures’ı başlattı. AWS, geride kalmamak için iş ortakları ve müşterilerinin öncülük ettiği üretken yapay zeka girişimlerini finanse etmek için 100 milyon dolarlık bir program başlattı.

Elbette AI alanında etrafa saçılan çok para var. Salesforce’un VC bölümü olan Salesforce Ventures, üretken yapay zeka teknolojileri geliştiren girişimlere 500 milyon dolar aktarmayı planlıyor. iş günü son zamanlarda özellikle yapay zeka ve makine öğrenimi girişimlerini desteklemek için mevcut risk sermayesi fonuna 250 milyon dolar ekledi. Accenture ve PwC, yapay zekaya sırasıyla 3 milyar dolar ve 1 milyar dolar yatırım yapmayı planladıklarını açıkladı.

Ancak yapay zeka alanının öne çıkan zorluklarına paranın çözüm olup olmadığı merak ediliyor.

Güvenli mesajlaşma uygulaması Signal’in başkanı Meredith Whittaker, bu hafta San Francisco’da düzenlenen bir Bloomberg konferansı sırasında düzenlenen aydınlatıcı bir panelde, günümüzün en popüler yapay zeka uygulamalarından bazılarının temelini oluşturan teknolojinin tehlikeli bir şekilde anlaşılmaz hale geldiğini öne sürdü. Bir bankaya giren ve borç isteyen birini örnek verdi.

Bu kişi kredi için reddedilebilir ve “dünyada bir sistem olduğu hakkında hiçbir fikri olmayabilir. [the] Whittaker, muhtemelen, kazınmış sosyal medyaya dayanarak benim itibarlı olmadığımı belirleyen bazı Microsoft API’leri tarafından destekleniyor, dedi. “asla bilemeyeceğim [because] Bunu bilmem için bir mekanizma yok.”

Sorun sermaye değil. Whittaker, bunun yerine mevcut güç hiyerarşisi olduğunu söylüyor.

“15, 20 yıldır masadayım. Ya sahibim olmuştur masada. Güçsüz bir masada olmak bir hiçtir” diye devam etti.

Tabii ki, yapısal değişimi başarmak, para için ortalıkta dolanmaktan çok daha zordur – özellikle de yapısal değişim mutlaka mevcut güçlerin lehine olmayacaksa. Ve Whittaker, yeterli geri itme olmazsa neler olabileceği konusunda uyarıyor.

Yapay zekadaki ilerleme hızlandıkça, toplumsal etkiler de hızlanıyor ve “Yapay zekaya doğru abartılı bir yolda” ilerlemeye devam edeceğiz, “burada bu güç, zeka kisvesi altında yerleşmiş ve doğallaştırılmış ve biz de gözetim altındayız. nokta [of having] bireysel ve kolektif yaşamlarımız üzerinde çok, çok az aracılık.”

O meli sektöre ara verin. Aslında olsun irade başka bir konudur. Bu, muhtemelen Eylül’de Disrupt’ta sahneye çıktığında tartışıldığını duyacağımız bir şey.

İşte son birkaç gündeki diğer AI not başlıkları:

  • DeepMind’in yapay zekası robotları kontrol eder: DeepMind, farklı robot kol modellerinde bir dizi görevi yerine getirebilen RoboCat adlı bir AI modeli geliştirdiğini söylüyor. Bu tek başına özellikle yeni değil. Ancak DeepMind, modelin birden çok görevi çözebilen ve bunlara uyum sağlayabilen ve bunu farklı, gerçek dünyadaki robotları kullanarak yapabilen ilk model olduğunu iddia ediyor.
  • Robotlar YouTube’dan öğreniyor: Robotlardan bahsetmişken, CMU Robotik Enstitüsü yardımcı doçenti Deepak Pathak bu hafta görücüye VRB (Vision-Robotics Bridge), bir insanın kaydını izleyerek robotik sistemleri eğitmek için tasarlanmış bir yapay zeka sistemi. Robot, temas noktaları ve yörünge dahil olmak üzere birkaç önemli bilgiyi izler ve ardından görevi yerine getirmeye çalışır.
  • Su samuru chatbot oyununa giriyor: Otomatik deşifre hizmeti Su samuru Bu hafta, katılımcıların bir toplantı sırasında ve sonrasında soru sormasına ve ekip arkadaşlarıyla işbirliği yapmalarına yardımcı olacak yapay zeka destekli yeni bir sohbet robotunu duyurdu.
  • AB, AI düzenlemesi için çağrıda bulunuyor: Avrupalı ​​düzenleyiciler, AI’nın bölgede nasıl düzenleneceğine ve nihai olarak ticari ve ticari olmayan amaçlarla kullanılacağına ilişkin bir yol ayrımında. Bu hafta, AB’nin en büyük tüketici grubu olan Avrupa Tüketici Örgütü (BEUC), kendi konumu ile tartılır: Ayak sürümeyi bırakın ve “üretken yapay zekanın risklerine ilişkin acil soruşturmaları hemen başlatın” deniyordu.
  • Vimeo, yapay zeka destekli özellikleri kullanıma sunuyor: Bu hafta Vimeo, kullanıcıların komut dosyaları oluşturmasına, yerleşik bir teleprompter kullanarak çekim kaydetmesine ve uzun duraklamaları ve “ahs” ve “ums” gibi istenmeyen akıcılıkları kayıtlardan kaldırmasına yardımcı olmak için tasarlanmış yapay zeka destekli bir araç paketini duyurdu.
  • Sentetik sesler için sermaye: Eleven LaboratuvarlarıSentetik sesler oluşturmaya yönelik yapay zeka destekli viral platform, yeni bir finansman turunda 19 milyon dolar topladı. ElevenLabs, Ocak ayı sonlarında lansmanından sonra oldukça hızlı bir şekilde hız kazandı. Ancak tanıtım her zaman olumlu olmadı – özellikle bir kez kötü aktörler platformu kendi amaçları için kullanmaya başladılar.
  • Sesi metne dönüştürme: Bir Fransız yapay zeka girişimi olan Gladia, OpenAI’nin Whisper transkripsiyon modelinden yararlanarak – bir API aracılığıyla – herhangi bir sesi metne neredeyse gerçek zamanlı hale getiren bir platform başlattı. Gladia, transkripsiyon işlemi yaklaşık 60 saniye sürerken, bir saatlik sesi 0,61 $ karşılığında yazıya dökebileceğini vaat ediyor.
  • Harness üretken yapay zekayı benimsiyor: Tesisatgeliştiricilerin daha verimli çalışmasına yardımcı olmak için bir araç seti oluşturan bir girişim olan , bu hafta platformuna küçük bir yapay zeka enjekte etti. Artık Harness, oluşturma ve devreye alma hatalarını otomatik olarak çözebilir, güvenlik açıklarını bulup düzeltebilir ve bulut maliyetlerini kontrol altına almak için önerilerde bulunabilir.

Diğer makine öğrenimleri

Bu hafta Kanada, Vancouver’da CVPR vardı ve keşke gidebilseydim çünkü konuşmalar ve belgeler çok ilginç görünüyor. Yalnızca birini izleyebiliyorsanız, göz atın Yejin Choi’nin açılış konuşması AI’nın olasılıkları, imkansızlıkları ve paradoksları hakkında.

Görsel Kaynakları: CVPR/YouTube

UW profesörü ve MacArthur Genius hibe alıcısı, ilk olarak günümüzün en yetenekli modellerinin beklenmedik birkaç sınırlamasını ele aldı. Özellikle, GPT-4 çarpmada gerçekten kötüdür. İki üç basamaklı sayının çarpımını şaşırtıcı bir oranda doğru bir şekilde bulamıyor, ancak biraz ikna ile zamanın %95’ini doğru yapabiliyor. Bir dil modelinin matematik yapamaması neden önemli? Çünkü şu anda yapay zeka pazarının tamamı, dil modellerinin vergilerinizi yapmak veya muhasebe yapmak gibi şeyler de dahil olmak üzere pek çok ilginç görevi iyi bir şekilde genelleştirdiği fikrine dayanıyor. Choi’nin amacı, AI’nın sınırlamalarını aramamız ve bize yetenekleri hakkında daha fazla bilgi verdiği için tersi değil, içe doğru çalışmamız gerektiğiydi.

Konuşmasının diğer bölümleri de aynı derecede ilginç ve düşündürücüydü. Tamamını buradan izleyebilirsiniz.

“Abartma avcısı” olarak tanıtılan Rod Brooks makine öğreniminin bazı temel kavramlarının ilginç bir tarihini verdi – sadece yeni görünen kavramlar çünkü onları uygulayan çoğu insan icat edildiğinde ortalıkta yoktu! Onlarca yıl öncesine giderek McCulloch, Minsky ve hatta Hebb’e değiniyor ve fikirlerin zamanlarının ötesinde nasıl geçerliliğini koruduğunu gösteriyor. Makine öğreniminin, savaş sonrası döneme kadar uzanan devlerin omuzlarında duran bir alan olduğunu hatırlatmakta fayda var.

CVPR’ye pek çok makale gönderildi ve sunuldu ve yalnızca ödül kazananlara bakmak indirgemeci olabilir, ancak bu bir haber toplantısı, kapsamlı bir literatür taraması değil. İşte konferanstaki jüri üyelerinin en ilginç bulduğu şey:

Görsel Kaynakları: AI2

VISPROG, AI2’deki araştırmacılardan, çok amaçlı bir kod araç kutusu kullanarak karmaşık görsel manipülasyon görevlerini gerçekleştiren bir tür meta modeldir. Diyelim ki çimenlerin üzerinde bir boz ayı resminiz var (resimde olduğu gibi) – ona “ayıyı karda bir kutup ayısıyla değiştirmesini” söyleyebilirsiniz ve çalışmaya başlar. Görüntünün bölümlerini tanımlar, görsel olarak ayırır, uygun bir değiştirmeyi arar ve bulur veya oluşturur ve kullanıcının başka bir yönlendirmesine gerek kalmadan her şeyi akıllı bir şekilde yeniden birleştirir. Blade Runner “geliştirme” arayüzü düpedüz sıradan görünmeye başlıyor. Ve bu, birçok yeteneğinden sadece biri.

“Planlama odaklı otonom sürüş” çok kurumlu bir Çinli araştırma grubundan, kendi kendine giden arabalara uyguladığımız parça parça yaklaşımın çeşitli parçalarını birleştirmeye çalışıyor. Normalde, her birinin bir dizi alt görevi (insanları bölümlere ayırma, engelleri belirleme vb.) Modelleri, tüm bunları tek bir modelde toplamaya çalışıyor, gördüğümüz gibi metin, ses veya görüntüleri girdi ve çıktı olarak kullanabilen çok modlu modeller gibi. Benzer şekilde bu model, modern bir otonom sürüş yığınının karmaşık karşılıklı bağımlılıklarını bazı yönlerden basitleştirir.

DynIBAR “dinamik Nöral Parlaklık Alanları” veya NeRF’ler kullanarak videoyla etkileşim kurmanın yüksek kaliteli ve sağlam bir yöntemini gösterir. Videodaki nesnelerin derinlemesine anlaşılması, video zaten kaydedildikten sonra genellikle mümkün olmasını beklemediğiniz sabitleme, kaydırma hareketleri ve diğer şeyler gibi şeylere olanak tanır. Yine… “geliştirin.” Bu kesinlikle Apple’ın sizi işe aldığı türden bir şey ve ardından bir sonraki WWDC’de övgüyü alıyor.

rüya kabini proje sayfasının yayına girdiği bu yılın biraz başından hatırlarsınız. Deepfake yapmak için şimdiye kadarki en iyi sistem, bunu söylemenin başka yolu yok. Elbette bu tür görüntü işlemlerini yapmak, eğlenceli olmasının yanı sıra değerli ve güçlüdür ve Google’daki gibi araştırmacılar bunu daha sorunsuz ve gerçekçi hale getirmek için çalışıyor. Sonuçlar… daha sonra, belki.

En iyi öğrenci kağıt ödülü, kafesleri veya 3B nokta bulutlarını karşılaştırma ve eşleştirme yöntemine gidiyor – açıkçası benim için açıklamaya çalışmak çok teknik, ancak bu gerçek dünya algısı için önemli bir yetenek ve iyileştirmeler memnuniyetle karşılanıyor. Örnekler ve daha fazla bilgi için buradaki makaleye göz atın.

Sadece iki külçe daha: Intel kendini gösterdi bu ilginç model, LDM3D, sanal ortamlar gibi 3D 360 görüntüler oluşturmak için. Yani metaverse’deyken “bizi ormanda büyümüş bir harabeye koy” dediğinizde, talep üzerine yeni bir tane yaratır.

Ve Meta yayınlandı Voicebox adlı bir ses sentezi aracı bu, giriş temiz olmasa bile seslerin özelliklerini çıkarmada ve bunları çoğaltmada çok iyidir. Genellikle ses çoğaltma için iyi miktarda ve çeşitli temiz ses kayıtlarına ihtiyacınız vardır, ancak Voicebox bunu diğerlerinden daha iyi yapar, daha az veriyle (2 saniye gibi düşünün). Neyse ki bu cini şimdilik şişede tutuyorlar. Seslerinin klonlanmasına ihtiyaç duyabileceklerini düşünenler için Acapela’ya bakın.



genel-24