Üretken yapay zeka sohbet robotlarının bilmediği veya cevaplayamadığı hâlâ birçok soru var. Öncelikle enerji açısından maliyeti ne kadar ve bilgiyi kimden alıyorlar. Yapay zekanın büyük isimlerinin laboratuvarlarında bu yönde çalışmalar sürüyor. Temel üretken yapay zeka hizmetlerini mümkün kılan sinir ağları üzerine yapılan araştırmalar, kaliteli verilere dayanan, daha az enerji tüketen, daha küçük ve daha uzmanlaşmış modellere odaklanıyor. Bu aynı zamanda genel sohbet robotlarının “çılgın” sorulara verdiği şaşırtıcı ama bazen yaratıcı fikirler veren yanıtların da sonu mu olacak?

Kaliforniya-Los Angeles Üniversitesi’nde (UCLA) Hesaplamalı Vizyon kürsüsü sahibi ve bilgisayar ürünleri ve teknolojileri araştırma ve geliştirmesine liderlik ettiği Amazon web servislerinin başkan yardımcısı Stefano Soatto, “Halüsinasyon, üretken modellerin bir özelliğidir” diye açıklıyor. hizmetler.yapay zeka -. Ancak halüsinasyon kontrol edilebilir ve yalnızca ihtiyacımız olduğunda kullanılabilir. Örneğin bir yazar “çılgın” bir soruya dayalı üretken içerik isteyebilir; Bununla birlikte, kullanıcı nesnel yanıtlar arıyorsa, nesnel bir yanıt oluşturmak için veritabanına harici bir çağrıyı tetikleyen bir kod dili dizisi oluşturmak mantıklı olacaktır. Yeni makul sentetik içerik üretebilen ve aynı zamanda gerçeklere dayalı bir yanıt gerektiren soruları doğru şekilde yanıtlayabilen bir modele sahip olmak, birbirini dışlayan özellikler değildir. Sonuçta, belirli alanlara özgü ve aynı zamanda diğer alanlara genel olan modellere sahip olmak arasında hiçbir ikilik veya uyumsuzluk yoktur.”

AWS: Amazon’un yanı sıra rakipleri için de çalışan küresel bir ekip

Dört kıtada 39 şehirde Stefano Soatto liderliğindeki küresel ekip, Kendra, Lex, Personalize, Textract, Rekognition, Transcribe, Forecast, CodeWhisperer ve son olarak büyük dil modeli (Llm) de dahil olmak üzere Amazon Bedrock gibi Amazon ürünlerinin piyasaya sürülmesinden sorumludur. Titan: Şirketler ihtiyaçlarına en uygun temel modelini bulabilir ve verilerini kullanarak geliştirebilirler. AWS başkan yardımcısı, Cortellazzo&Soatto firması ile Üniversite Dostları derneği tarafından 4 Ekim’de Padua’da düzenlenen konferansta girişimcilere “Aws Amazon için çalışıyor, aynı zamanda rakipleri için de çalışıyor” diye hatırlattı. Geleceğin programlama dili doğal dildir. Çok fazla değişiklik olacak ve çok hızlı olacak, ancak bu, şu anda bu modelleri oluşturacak yapıya ve beceriye sahip olmayanlar için birçok fırsat yaratacak.”

Sinir ağı modellerinin damıtılması süreci

Büyük şirketlerin maliyetleri ve enerji tüketimini azaltma yönündeki baskısı çok büyük ve araştırmaları, herkesin erişebileceği bir akıllı telefona uygulanabilecek küçük modeller elde etmeye yönlendiriyor. Ama kaliteden kısmen vazgeçmek zorunda kalma riski yok mu? “Duruma bağlıdır,” diye yanıtlıyor Soatto -. Bazı çok güçlü fenomenler, örneğin düşünce zinciri veya modeller bağlam içi öğrenme, yalnızca belirli ölçeklerde ortaya çıkar. Bununla birlikte, bazı küçük modeller, örneğin öğrenmenin daha rafine verilerle yapılması durumunda, daha büyük modellere eşit veya bazı durumlarda daha üstün performans üretmektedir. Bu, bazı durumlarda daha küçük ve daha kesin olanı veya enerji ve ekonomik açıdan daha verimli olanı çıkarmak için modellerin ayrıştırılması sürecidir. Genellikle bir modeli azaltmak isteyenler bunu belirli sorunları çözmek istedikleri ve genelci bir modelle ilgilenmedikleri için yaparlar. Daha sonra, yalnızca özel bilgileri gören bir ağa kıyasla, daha büyük bir modelden başlayıp onu spesifik olarak “damıtarak” genel olarak daha iyi bir modelin elde edildiği keşfedildi. Herhangi bir istisna var mı? Amazon web servislerinin başkan yardımcısı, “Bazı çok özel alan adları, herhangi bir büyük, daha sonra damıtılmış modelden daha iyi çalışıyor” diyor. Bunun örnekleri arasında AwS, Ses tanıma için Transcribe veya bir sesli etkileşim hizmeti olan Alexa sayılabilir. Bir başka örnek ise nesnelerin görüntülerden tanınmasıdır: Üretimi kontrol etmek istiyorsam ve nesnelerimin tam olarak nasıl yapıldığını biliyorsam, uzman model daha iyi çalışır.”



genel-18