Kelimeler ve görüntüler. İki yapay zeka deneyi, şirketlerin, kurumların ve politik konuların çalışma şeklini değiştirmeye aday bu teknolojinin sınırlarını anlamamıza yardımcı oluyor. Birincisi Google’dan ve “ayet ayet” olarak adlandırılıyor. İngilizcedir ve bir şiir üreticisidir. Herkesin 22 ünlü şairin tarzında şiirler yaratmasına izin vermek daha iyidir. Küçük bir oyun gibi görünse de daha da iyisi, bu makine öğrenimi algoritmalarından bazılarının nasıl çalıştığına dair plastik bir örnek. Bu durumda, Google mühendisleri, algoritmayı her yazarın tüm çalışmasını besleyerek modeli eğitti. Sistem her şeyi “okudu” ama hiçbir şey anlamadı. Bireysel şairin şiirinin tarzını, düzenini, diyelim ki sesini öğrenmiştir. Uygulamada, bir cümle yazılır ve sistem, anlamsal bir teknoloji modülü aracılığıyla, seçilen şairlere ve cümlenin “anlamsal” anlamına göre bir ayet seçeneği önerir. Sonuç garip ama etkili. Çünkü muhtemeldir. Bir şiir gibi görünüyor.

Dall-E 2 benzer bir mantık kullanır ancak görüntülere uygulanır. Elon Musk ve Sam Altman tarafından kurulan kar amacı gütmeyen kuruluş OpenAI’nin yeni projesi, bir tür otomatik illüstratör. Almak istediğiniz görüntünün açıklamasından başlıktan başlar, AI mesajı anlar, öğeleri arar ve çizimi oluşturur. Metinden görüntüye modeller genellikle doğrudan web’den alınan büyük veri kümeleri üzerinde eğitilir ve bu da çeşitli sorunlara yol açabilir. Teknik olarak DALL-E 2 bir montaj hattıdır. Clip (Karşıtlıklı Dil-Görüntü Ön Eğitimi) adlı bir model, metinsel bir altyazıyı bir temsil alanına eşler, ardından Glide adlı başka bir harita modeli, metin ve görüntüyü istatistiksel olarak ilişkilendirir, yani öğelerin hiyerarşilerini inceler. Bir de görsel kodlamayla birlikte bu metinsel kodlama – bir resim – bu, resim yazısı tarafından haritalanan anlamsal bilgiyi yakalar. Özetle, sistem, metin ve görüntünün istatistiksel olarak benzer olmasına izin veren bir yöntem kullanır, yani ilgili görüntünün metnin metnin hangi bölümüne karşılık geldiğini tanımlar. Son olarak, difüzyon adı verilen bir teknik, öğrenilenleri “temellendirilmiş” olarak koymakla ilgilenir. Bu tekniğin üretken yapay zeka alanında kullanılması Dall-E 2’nin asıl yeniliğidir. Bu küçük bir adımdır, ancak bu disiplin böyle yapılır.

Google da birkaç gün önce Imagen’i sunarak aynı çizgide hareket etti. Burada da, metinsel bir açıklamadan başlayarak görüntüler oluşturabilen bir yapay zeka sistemidir: Google Araştırma Beyin Ekibine göre Imagen, “benzeri görülmemiş derecede bir fotogerçekçilik ve derin bir dil anlayışı sunabilecektir. “. Google Araştırma Beyin Ekibi ayrıca Imagen’in “büyük dil modellerinin sosyal önyargılarını ve sınırlamalarını miras aldığına ve zararlı klişeler ve temsiller sunabileceğine” dikkat çekiyor.



genel-18