Yapay zeka kadar hızlı hareket eden bir sektöre ayak uydurmak zor bir iştir. Bu nedenle, bir yapay zeka sizin yerinize yapana kadar, makine öğrenimi dünyasında geçen haftaki hikayelerin yanı sıra kendi başımıza ele almadığımız önemli araştırma ve deneylerin kullanışlı bir özetini burada bulabilirsiniz.

AI’da bu hafta Amazon, ürün incelemelerini “geliştirmek” için üretken AI’dan yararlanmaya başlayacağını duyurdu. Özellik kullanıma sunulduğunda, ürün ayrıntıları sayfasında incelemelerde bahsedilen ürün özelliklerini ve müşteri duyarlılığını vurgulayan kısa bir metin paragrafı sağlayacaktır.

Kulağa kullanışlı bir özellik gibi geliyor, değil mi? Belki alışveriş yapanlar ve satıcılar için. Peki ya eleştirmenler?

Amazon incelemelerinin bir tür yüksek sanat olduğunu iddia etmeyeceğim. Aksine, platformdaki adil bir sayı gerçek değildir veya yapay zeka tarafından oluşturulmuştur.

Ancak bazı yorumcular, ister alışveriş yapan arkadaşları için gerçek bir endişeden, ister yaratıcı enerjinin akmasını sağlama çabasından, yalnızca bilgi veren değil aynı zamanda eğlendiren incelemeler hazırlamak için zaman ayırır. Bu incelemelerin özetleri onlara haksızlık eder ve asıl noktayı tamamen gözden kaçırır.

Belki de bu taşlara rastladınız. Genellikle, kitapların ve filmlerin inceleme bölümlerinde bulunurlar; burada, anekdot deneyimlerime göre, Amazon eleştirmenleri daha … ayrıntılı olma eğilimindedir.

Görsel Kaynakları: Amazon

Amazon kullanıcısını ele alalım “Sweet Home’s” gözden geçirmek JD Salinger’ın 2.000’den fazla kelimeyle çalışan “Çavdar Tarlasında Çocuklar”ından. William S. Burroughs ve Jack Kerouac’ın yanı sıra George Bernard Shaw, Gary Snyder ve Dorothy Parker’ın eserlerine atıfta bulunan Sweet Home’un incelemesi, bir incelemeden çok, kalıcılığını açıklamak için romanın konularını seçip bağlamsallaştıran kapsamlı bir analizdir. güç.

Ve sonra, Thomas Pynchon’un rezil yoğun romanı “Gravity’s Rainbow” hakkında Bryan Desmond’ın eleştirisi var. Benzer şekilde uzun – 1.120 kelime – bir incelemeden bekleneceği gibi, yalnızca kitabın öne çıkanlarının (göz kamaştırıcı düzyazı) ve önemsiz noktalarının (modası geçmiş tutumlar, özellikle kadınlara karşı) altını çizmekle kalmaz, aynı zamanda Desmond’ın kitabı okuma deneyimini çok ayrıntılı olarak aktarır.

AI bunları özetleyebilir mi? Elbette. Ama nüans ve içgörü pahasına.

Elbette Amazon, AI tarafından oluşturulan özetler lehine incelemeleri gizlemeyi düşünmüyor. Ancak, çalışmaları ortalama bir müşteri tarafından giderek daha fazla okunmazsa, eleştirmenlerin neredeyse aynı kadar zaman ve dikkat harcamaya daha az eğilimli olacaklarından korkuyorum. Bu büyük bir deney ve sanırım – üretken yapay zekanın dokunduğu şeylerin çoğunda olduğu gibi – bunu yalnızca zaman gösterecek.

İşte son birkaç gündeki diğer bazı AI hikayeleri:

  • AI’m haydutlaşıyor: Snapchat’in bu yılın başlarında piyasaya sürülen uygulama içi yapay zeka sohbet robotu My AI özelliği, tartışmaların adil bir payına sahip, kısaca kendi başına bir zihne sahip gibi görünüyordu. Salı günü AI kendi Hikayesini uygulamaya gönderdi ve ardından bazı Snapchat kullanıcılarının rahatsız edici bulduğu kullanıcıların mesajlarına yanıt vermeyi bıraktı. Snapchat ana şirketi Snap daha sonra bunun bir hata olduğunu doğruladı.
  • OpenAI yeni denetleme tekniği önerir: OpenAI, içerik denetimi için amiral gemisi üretken AI modeli olan GPT-4’ü kullanmanın bir yolunu geliştirdiğini ve insan ekiplerinin üzerindeki yükü hafiflettiğini iddia ediyor.
  • OpenAI bir şirket satın aldı: Daha fazla OpenAI haberinde, yapay zeka girişimi, yaratıcı araçlar, altyapı ve dijital deneyimler oluşturmak için yapay zekadan yararlanan New York merkezli bir girişim olan Global Illumination’ı satın aldı. Bu, OpenAI’nin kabaca yedi yıllık tarihindeki ilk halka açık kazanımı.
  • Yeni bir LLM eğitim veri seti: Allen Yapay Zeka Enstitüsü, OpenAI’nin ChatGPT’si gibi, inceleme için ücretsiz olarak kullanılabilen büyük dil modelleri (LLM’ler) için devasa bir metin veri kümesi yayınladı. Veri kümesi olarak adlandırılan Dolma, araştırma grubunun planlanan açık dil modeli veya OLMo (Dolma, “OLMo’nun İştahını Besleyecek Verilerin kısaltmasıdır) için temel oluşturmayı amaçlamaktadır.
  • Bulaşık yıkama, kapı açma robotları: ETH Zürih’teki araştırmacılar, robotlara kapıları açma ve kapılardan geçme gibi görevleri ve daha fazlasını yapmayı öğretmek için bir yöntem geliştirdiler. Ekip, sistemin farklı form faktörlerine uyarlanabileceğini söylüyor, ancak basitlik adına, burada görülebilen dört ayaklı bir üzerinde demolar gerçekleştirdiler.
  • Opera bir AI asistanı alır: Opera’nın iOS için web tarayıcı uygulaması bir AI asistanı alıyor. Şirket ilan edildi Bu hafta iOS’ta Opera, OpenAI ile işbirliği içinde oluşturulmuş, doğrudan web tarayıcısına entegre edilmiş ve tüm kullanıcılar için ücretsiz olan tarayıcı yapay zeka ürünü Aria’yı içerecek.
  • Google, AI özetlerini benimsiyor: Google bu hafta, yaklaşık üç aylık Arama Üretken Deneyimi (SGE) için birkaç yeni güncelleme yayınladı., kullanıcıların web’de keşfettikleri bilgileri daha iyi öğrenmelerine ve anlamlandırmalarına yardımcı olmayı amaçlayan, şirketin Arama’daki yapay zeka destekli konuşma modu. Özellikler, bilmediğiniz terimlerin tanımlarını görmek için araçları, diller arasında bilginizi anlamanızı ve kodlamayı geliştirmenize yardımcı olanları ve göz atarken SGE’nin AI gücünden yararlanmanıza izin veren ilginç bir özelliği içerir.
  • Google Fotoğraflar yapay zeka kazanıyor: Google Fotoğraflar bir ekledi En sevdiğiniz anıları kaydetmenize veya sıfırdan kendi anılarınızı yaratmanıza olanak tanıyan yeni Anılar görünümünün kullanıma sunulmasıyla en unutulmaz anlarınızı yeniden yaşamanın ve paylaşmanın yeni bir yolu. Anılar ile en unutulmaz gezileriniz, kutlamalarınız ve sevdiklerinizle geçirdiğiniz günlük anlar gibi şeyleri içeren not defteri benzeri bir zaman çizelgesi oluşturabilirsiniz.
  • Anthropic daha fazla nakit topluyor: antropikEski OpenAI liderleri tarafından ortaklaşa kurulan bir yapay zeka girişimi, Güney Kore’nin en büyük mobil operatörlerinden birinden 100 milyon dolar fon alacak. SK Telekom, telekomünikasyon şirketi Pazar günü duyurdu. Finansman haberi, Anthropic’in Mayıs ayında Spark Capital liderliğindeki C Serisi finansman turunda 450 milyon dolar toplamasından üç ay sonra geldi.

Daha fazla makine öğrenimi

Ben (yani, ortak yazarınız Devin) geçen hafta SIGGRAPH’taydım, burada yapay zeka şu anda film ve TV endüstrisinde bir öcü olmasına rağmen hem bir araç hem de araştırma konusu olarak tam güçteydi. Yakında VFX sanatçıları tarafından yenilikçi ve tamamen tartışmasız şekillerde nasıl kullanıldığına dair daha uzun bir hikayem olacak, ancak sergilenen kağıtlar da oldukça harikaydı. Bu oturum özellikle birkaç ilginç yeni fikri vardı.

Görsel Kaynakları: Tel Aviv Üniversitesi

Görüntü üreten modellerde şu garip şey vardır: Onlara “beyaz bir kedi ve siyah bir köpek” çizmelerini söylerseniz, genellikle ikisini karıştırır, birini yok sayar veya bir kedi köpeği veya hem siyah hem de beyaz olan hayvanlar yapar. Tel Aviv Üniversitesi’nden “katılmak ve heyecanlandırmak” adlı bir yaklaşım, uyarıyı dikkat yoluyla bileşenlerine ayırıyor ve ardından ortaya çıkan görüntünün her birinin uygun temsillerini içerdiğinden emin oluyor. Sonuç, çok özneli istemleri ayrıştırmada çok daha iyi bir modeldir. Yakında sanat jeneratörlerine entegre edilmiş böyle bir şey görmeyi beklerdim!

Görsel Kaynakları: MIT/Max Planck Enstitüsü

Üretken sanat modellerinin bir başka zayıflığı da, konunun biraz daha yandan görünmesi gibi küçük değişiklikler yapmak istiyorsanız, her şeyi yeniden yapmanız gerekmesidir – bazen başlangıçta görüntüde sevdiğiniz şeyleri kaybedersiniz. “GAN’ınızı Sürükleyin” kullanıcının noktaları birer birer veya birkaç kez ayarlamasına ve hareket ettirmesine izin veren oldukça şaşırtıcı bir araçtır – resimde görebileceğiniz gibi, bir aslanın kafası görüntünün sadece o kısmı yeniden oluşturularak döndürülebilir veya ağzı açılabilir. Yeni oranlara uyum sağlamak için. Google yazar listesinde olduğundan, bunu nasıl kullanacaklarına baktıklarına bahse girebilirsiniz.

Görsel Kaynakları: Tel Aviv Üniversitesi

Bu “anlamsal tipografi” makalesi daha eğlenceli ama aynı zamanda son derece zekice. Her harfi bir vektör görüntüsü olarak ele alarak ve bu görüntüyü bir kelimenin atıfta bulunduğu nesnenin bir vektör görüntüsüne doğru iterek, oldukça etkileyici logolar oluşturur. Şirketinizin adını nasıl görsel bir kelime oyununa çevireceğiniz konusunda kararsızsanız, bu başlamak için harika bir yol olabilir.

Başka yerlerde, beyin bilimi ve AI arasında bazı ilginç çapraz tozlaşma var.

Bu kadar basit değil.

Bu Berkeley araştırmacıları müzik dinlerken beyin aktivitesini yorumlamak ve ritim, melodi veya vokallere odaklanan bazı kümeleri yeniden oluşturmak için bir makine öğrenimi modeli kullandı. Bu tür “beyni okuyoruz” türü çalışmalara her zaman şüpheyle yaklaşmışımdır, bu yüzden biraz şüpheyle karşılayın, ancak makine öğrenimi bir sinyali gürültüden ayırmada harikadır ve beyin aktivitesi çok, çok gürültülüdür.

MIT ve Harvard iş birliği yaptı beyindeki henüz bilinmeyen bazı işlevleri yerine getiren hücreler olan astrositler hakkındaki anlayışımızı ilerletmeye çalışmak. Hücrelerin bir dönüştürücü veya dikkat mekanizması gibi hareket edebileceğini öne sürüyorlar – bir makine öğrenimi kavramı beyine haritalanıyor, tersi değil! MIT’den kıdemli makale yazarı Dmitry Krotov bunu çok iyi özetliyor:

Beyin, geliştirdiğimiz en iyi yapay sinir ağlarından bile çok daha üstündür, ancak beynin tam olarak nasıl çalıştığını tam olarak bilmiyoruz. Biyolojik donanım ile büyük ölçekli yapay zeka ağları arasındaki bağlantıları düşünmenin bilimsel değeri vardır. Bu, yapay zeka için sinirbilim ve sinirbilim için yapay zekadır.

Tıbbi yapay zekada, tüketici cihazlarından gelen veriler de genellikle gürültülü veya güvenilmez olarak kabul edilir. Ancak yine de ML sistemleri uyum sağlayabilir, Yale’den gelen bu yeni makalenin gösterdiği gibi. Araştırma, bizi kalple ilgili sorunlar akut hale gelmeden önce uyaran giyilebilir cihazlara yaklaştırmalıdır.

Öğrenciler boş sandalye bulma uygulamasını gösterirler.

GPT-4’ün ilk pratik uygulamalarından biri, uzak bir iş ortağının yardımıyla görme engelli kişilerin gezinmesine yardımcı olan bir uygulama olan Be My Eyes’da kullanılmasıydı. EPFL öğrencileri iki uygulama daha geliştirdi görme engelli herkes için oldukça güzel olabilir. Biri kullanıcıyı bir odadaki boş bir koltuğa yönlendiriyor, diğeri ise ilaç şişelerinden sadece ilgili bilgileri okuyor: etken madde, dozaj, vb. Ne kadar basit ama gerekli görevler!

Son olarak yürümeye başlayan çocuk eşdeğerimiz var CMU ve Meta tarafından geliştirilen “RoboAgent”bir çocuğun yaptığı gibi, sadece bir şeylere bakarak ve dokunarak bir şeyleri almak veya nesne etkileşimlerini anlamak gibi günlük becerileri öğrenmeyi amaçlar.

CMU’dan Shubham Tulsiani, “Bu tür bir öğrenme yeteneğine sahip bir ajan, bizi, çeşitli görünmeyen ortamlarda çeşitli görevleri tamamlayabilen ve daha fazla deneyim topladıkça sürekli olarak gelişen genel bir robota yaklaştırıyor” dedi. Aşağıda proje hakkında daha fazla bilgi edinebilirsiniz:



genel-24