Yapay zeka kadar hızlı hareket eden bir sektöre ayak uydurmak zor bir iştir. Bu nedenle, bir yapay zeka sizin yerinize yapana kadar, makine öğrenimi dünyasında geçen haftaki hikayelerin yanı sıra kendi başımıza ele almadığımız önemli araştırma ve deneylerin kullanışlı bir özetini burada bulabilirsiniz.
Bu hafta Google, yıllık I/O geliştirici konferansında lanse ettiği bir dizi yeni ürünle yapay zeka haber döngüsüne hakim oldu. GitHub’ın Copilot’uyla rekabet etmesi amaçlanan kod üreten bir yapay zekadan, metin istemlerini kısa şarkılara dönüştüren bir yapay zeka müzik üretecine kadar gamı çalıştırıyorlar.
Bu araçların oldukça büyük bir kısmı meşru emek tasarrufu sağlıyor gibi görünüyor – yani pazarlama tüylerinden daha fazlası. Kişisel bir Google Dokümanlar klasöründeki dosyaları düzenlemek, özetlemek ve analiz etmek için yapay zekadan yararlanan bir not alma uygulaması olan Project Tailwind özellikle ilgimi çekiyor. Ancak günümüzün en iyi AI teknolojilerinin bile sınırlamalarını ve eksikliklerini ortaya koyuyorlar.
Örneğin, Google’ın en yeni büyük dil modelini (LLM) PaLM 2’yi ele alalım. PaLM 2, şirketin OpenAI’nin ChatGPT’sine rakibi olan Google’ın güncellenmiş Bard sohbet aracını güçlendirecek ve Google’ın yeni AI özelliklerinin çoğu için temel model işlevi görecek. Ancak PaLM 2, karşılaştırılabilir LLM’ler gibi kod, e-posta ve daha fazlasını yazabilirken, aynı zamanda sorulara toksik ve önyargılı şekillerde yanıt verir.
Google’ın müzik üreteci de başarabilecekleri konusunda oldukça sınırlıdır. Kendi ellerimle yazdığım gibi, MusicLM ile yarattığım şarkıların çoğu en iyi ihtimalle kabul edilebilir ve en kötü ihtimalle dört yaşında bir çocuğun kendini serbest bırakması gibi geliyor. DAW.
Yapay zekanın potansiyel olarak 300 milyon tam zamanlı işe eşdeğer işlerin yerini alacağı hakkında çok şey yazıldı. rapor Goldman Sachs tarafından. İçinde anket Harris’in yazdığına göre, OpenAI’nin yapay zeka destekli sohbet robotu aracı ChatGPT’ye aşina olan çalışanların %40’ı, bunun işlerinin tamamen yerini alacağından endişe ediyor.
Google’ın yapay zekası her şeyin sonu değil. Nitekim şirketin tartışmasız arkasında AI yarışında. Ancak Google’ın istihdam ettiği yadsınamaz bir gerçektir. dünyanın en iyi AI araştırmacılarından bazıları. Ve eğer yönetebileceklerinin en iyisi buysa, bu, AI’nın çözülmüş bir sorun olmaktan uzak olduğunun bir kanıtıdır.
İşte son birkaç gündeki diğer AI not başlıkları:
- Meta, üretken AI’yı reklamlara getiriyor: Meta bu hafta, reklamverenlerin alternatif kopyalar oluşturmalarına, metin istemleri aracılığıyla arka plan oluşturmalarına ve Facebook veya Instagram reklamları için resim kırpmalarına yardımcı olacak bir tür yapay zeka sanal alanını duyurdu. Şirket, özelliklerin şu anda belirli reklamverenlerin kullanımına sunulduğunu ve Temmuz ayında daha fazla reklamverenin erişimini genişleteceğini söyledi.
- Bağlam eklendi: Anthropic, hala önizleme aşamasında olan en önemli metin üreten AI modeli olan Claude için bağlam penceresini 9.000 jetondan 100.000 jetona genişletti. Bağlam penceresi, modelin ek metin oluşturmadan önce dikkate aldığı metne atıfta bulunurken, belirteçler ham metni temsil eder (örneğin, “fantastik” kelimesi, “fan”, “tas” ve “tic” belirteçlerine bölünür). Tarihsel olarak ve bugün bile, zayıf bellek, metin üreten yapay zekanın kullanışlılığının önünde bir engel olmuştur. Ancak daha büyük bağlam pencereleri bunu değiştirebilir.
- Antropik ‘anayasal AI’yı öne sürüyor: Daha büyük bağlam pencereleri, Antropik modellerin tek farklılaştırıcı özelliği değildir. Şirket bu hafta, yapay zeka sistemlerine bir “anayasa” tarafından tanımlanan “değerler” aşılamayı amaçlayan şirket içi yapay zeka eğitim tekniğini “anayasal yapay zeka” olarak detaylandırdı. Anthropic, diğer yaklaşımların aksine, anayasal yapay zekanın sistemlerin davranışını hem anlaşılmasını kolaylaştırdığını hem de gerektiğinde ayarlanmasını kolaylaştırdığını savunuyor.
- Araştırma için oluşturulmuş bir LLM: Kâr amacı gütmeyen Allen Institute for AI Research (AI2), büyük ve büyüyen açık kaynak kitaplığına ek olarak Açık Dil Modeli adlı araştırma odaklı bir LLM yetiştirmeyi planladığını duyurdu. AI2, Açık Dil Modeli’ni veya kısaca OLMo’yu yalnızca bir model olarak değil, bir platform olarak görüyor; bu, araştırma topluluğunun AI2’nin oluşturduğu her bileşeni alıp ya kendilerinin kullanmasına ya da iyileştirmeye çalışmasına izin verecek.
- AI için yeni fon: Diğer AI2 haberlerinde, kar amacı gütmeyen kuruluşun AI başlangıç fonu olan AI2 Incubator, önceki boyutunun üç katına çıkıyor – 10 milyon dolara karşı 30 milyon dolar. 2017’den beri kuluçka makinesinden geçen yirmi bir şirket, yaklaşık 160 milyon dolarlık ek yatırım ve en az bir büyük satın alma aldı: XNOR, daha sonra Apple tarafından yaklaşık 200 milyon dolara satın alınan bir yapay zeka hızlandırma ve verimlilik birimi.
- Üretken yapay zeka için AB kurallarını tanıtıyor: Avrupa Parlamentosu’nda yapılan bir dizi oylamada, bu hafta Avrupa Parlamentosu Üyeleri, OpenAI’nin ChatGPT’si gibi üretken AI teknolojilerinin temelini oluşturan sözde temel modeller için gerekliliklerin belirlenmesi de dahil olmak üzere, bloğun AI mevzuat taslağında bir dizi değişikliği desteklediler. Değişiklikler, temel model sağlayıcılarına, modellerini piyasaya sürmeden önce güvenlik kontrolleri, veri yönetişim önlemleri ve risk azaltmaları uygulama sorumluluğunu yüklüyor.
- Evrensel çevirmen: Google, videoyu yeni bir dilde yayınlarken aynı zamanda konuşmacının dudaklarını hiç konuşmadıkları kelimelerle senkronize eden güçlü ve yeni bir çeviri hizmetini test ediyor. Pek çok nedenden dolayı çok yararlı olabilir, ancak şirket kötüye kullanım olasılığı ve bunu önlemek için atılan adımlar konusunda açık sözlüydü.
- Otomatik açıklamalar: OpenAI’nin ChatGPT’si gibi LLM’lerin bir kara kutu olduğu sık sık söylenir ve kesinlikle bunda bazı gerçekler vardır. Katmanlarını soymak için OpenAI, gelişen LLM’nin hangi bölümlerinin hangi davranışlarından sorumlu olduğunu otomatik olarak belirleyen bir araç. Arkasındaki mühendisler bunun erken aşamalarda olduğunu vurguluyor, ancak onu çalıştıracak kod bu hafta itibariyle GitHub’da açık kaynak olarak mevcut.
- IBM, yeni yapay zeka hizmetlerini başlatıyor: IBM, yıllık Think konferansında yapay zeka modelleri oluşturmak için araçlar sağlayan ve bilgisayar kodu, metin ve daha fazlasını oluşturmak için önceden eğitilmiş modellere erişim sağlayan yeni bir platform olan IBM Watsonx’i duyurdu. Şirket, lansmanın, birçok işletmenin iş yerinde yapay zekayı dağıtma konusunda hâlâ yaşadığı zorluklardan kaynaklandığını söylüyor.
Diğer makine öğrenimleri
Andrew Ng’nin yeni şirketi iniş yapay zekası bilgisayarla görme eğitimi oluşturmak için daha sezgisel bir yaklaşım benimsiyor. Bir modelin, resimlerde neyi tanımlamak istediğinizi anlamasını sağlamak oldukça zahmetli bir iştir, ancak onların “görsel yönlendirme” tekniği sadece birkaç fırça darbesi yapmanıza izin verir ve oradan niyetinizi anlar. Segmentasyon modelleri oluşturmak zorunda kalan herkes “Tanrım, sonunda!” diyor. Muhtemelen şu anda organelleri ve ev eşyalarını maskelemek için saatler harcayan birçok yüksek lisans öğrencisi.
Microsoft başvurdu benzersiz ve ilginç bir şekilde difüzyon modelleri, esasen bunları bir görüntü yerine bir eylem vektörü oluşturmak için kullanıyor, onu birçok gözlemlenen insan eylemi üzerinde eğitmiş. Henüz çok erken ve difüzyon bunun için bariz bir çözüm değil, ancak kararlı ve çok yönlü olduklarından, tamamen görsel görevlerin ötesinde nasıl uygulanabileceklerini görmek ilginç. Makaleleri bu yıl ICLR’de sunulacak.
Meta ayrıca AI’nın kenarlarını zorluyor GörüntüBind, altı farklı modaliteden verileri işleyip entegre edebilen ilk model olduğunu iddia ediyor: görüntüler ve video, ses, 3B derinlik verileri, termal bilgiler ve hareket veya konum verileri. Bu, küçük makine öğrenimi yerleştirme alanında, bir görüntünün bir sesle, bir 3B şekille ve çeşitli metin açıklamalarıyla ilişkilendirilebileceği ve bunlardan herhangi birinin sorulabileceği veya bir karar vermek için kullanılabileceği anlamına gelir. Verileri daha çok beyin gibi emdiği ve ilişkilendirdiği için “genel” yapay zekaya doğru bir adımdır – ancak yine de temel ve deneyseldir, bu yüzden henüz çok heyecanlanmayın.
Herkes AlphaFold hakkında heyecanlandı ve bunun iyi bir nedeni var, ancak gerçekten yapı, çok karmaşık proteomik biliminin sadece küçük bir parçası. Hem önemli hem de tahmin edilmesi zor olan, bu proteinlerin nasıl etkileşime girdiğidir – ama bu yeni EPFL’den PeSTo modeli tam da bunu yapmaya çalışır. Baş geliştirici Lucien Krapp, “Protein yapısı içindeki önemli atomlara ve etkileşimlere odaklanıyor” dedi. “Bu, protein bağlama arayüzlerinin doğru bir şekilde tahmin edilmesini sağlamak için bu yöntemin protein yapıları içindeki karmaşık etkileşimleri etkili bir şekilde yakaladığı anlamına gelir.” Kesin veya %100 güvenilir olmasa bile sıfırdan başlamak zorunda olmamak araştırmacılar için çok faydalıdır.
Federaller yapay zeka konusunda büyüyor. Başkan araya girdi bile bir grup üst düzey AI CEO’su ile toplantı bunu doğru yapmanın ne kadar önemli olduğunu söylemek için. Belki bir grup şirket sorulacak doğru şirket olmayabilir ama en azından üzerinde düşünmeye değer bazı fikirleri olacaktır. Ama zaten lobicileri var, değil mi?
hakkında daha fazla heyecanlıyım federal fonla ortaya çıkan yeni yapay zeka araştırma merkezleri. OpenAI ve Google gibi şirketler tarafından yapılan ürün odaklı çalışmaları dengelemek için temel araştırmaya büyük ölçüde ihtiyaç vardır. sosyal bilimler (CMU’da)veya iklim değişikliği ve tarım (U of Minnesota’da çalışıyor), yeşil alanlar gibi hissettiriyor (hem mecazi hem de gerçek anlamda). Yine de buna biraz seslenmek istiyorum Ormancılık ölçümü üzerine meta araştırma.
AI hakkında birçok ilginç konuşma var. düşündüm UCLA (mezun olduğum okul, git Bruins) akademisyenleri Jacob Foster ve Danny Snelson ile bu röportaj ilginç biriydi. İşte bu hafta sonu insanlar AI hakkında konuşurken ortaya çıkmış gibi davranabileceğiniz LLM’ler hakkında harika bir fikir:
Bu sistemler, çoğu yazının biçimsel olarak ne kadar tutarlı olduğunu ortaya koyuyor. Bu tahmine dayalı modellerin simüle ettiği biçimler ne kadar genelse, o kadar başarılı olurlar. Bu gelişmeler bizi biçimlerimizin normatif işlevlerini tanımaya ve potansiyel olarak onları dönüştürmeye itiyor. Temsili bir alanı yakalamada çok iyi olan fotoğrafın piyasaya sürülmesinden sonra, ressam ortamı, boyanın kendisinin maddiliğiyle oyalanmak için doğru temsili tamamen reddeden bir tarz olan İzlenimciliği geliştirdi.
Kesinlikle bunu kullanarak!