Meta’nın yapay zeka araştırma laboratuvarları, son teknoloji ürünü yeni bir sohbet robotu yarattı ve yetenekleri hakkında geri bildirim toplamak için halkın sistemle konuşmasına izin veriyor.
Botun adı BlenderBot 3 ve web üzerinden erişilebilir. (Yine de, şu anda yalnızca ABD’de ikamet edenler bunu yapabilir gibi görünüyor.) BlenderBot 3 genel sohbete katılabiliyor, diyor Meta, ancak aynı zamanda bir dijital asistana sorabileceğiniz türden soruları yanıtlıyor, “sağlık hakkında konuşmaktan şehirde çocuk dostu olanaklar bulmak için yemek tarifleri.”
Bot bir prototiptir ve Meta’nın önceki iş büyük dil modelleri veya LLMS olarak bilinenlerle – güçlü ancak kusurlu metin oluşturma yazılımı, OpenAI’nin GPT-3’ü en yaygın olarak bilinen örnektir. Tüm LLM’ler gibi, BlenderBot da başlangıçta, dil oluşturmak için istatistiksel kalıplar için kullandığı geniş metin veri kümeleri üzerinde eğitilir. Bu tür sistemlerin son derece esnek olduğu kanıtlanmıştır ve programcılar için kod üretmekten yazarların bir sonraki en çok satanlarını yazmalarına yardımcı olmaya kadar bir dizi kullanıma sunulmuştur. Ancak, bu modellerin de ciddi kusurları vardır: ön yargıları kusmak eğitim verilerinde ve sıklıkla kullanıcıların sorularına cevaplar icat (dijital asistanlar olarak faydalı olacaklarsa büyük bir sorun).
Bu son sorun, Meta’nın özellikle BlenderBot ile test etmek istediği bir şeydir. Chatbotun büyük bir özelliği, belirli konular hakkında konuşmak için internette arama yapabilmesidir. Daha da önemlisi, kullanıcılar bilgileri nereden aldıklarını görmek için yanıtlarına tıklayabilirler. Başka bir deyişle BlenderBot 3, kaynaklarını alıntılayabilir.
Chatbot’u genel halka yayınlayarak Meta, büyük dil modellerinin karşılaştığı çeşitli sorunlar hakkında geri bildirim toplamak istiyor. BlenderBot ile sohbet eden kullanıcılar, sistemden gelen herhangi bir şüpheli yanıtı işaretleyebilecekler ve Meta, “botların kaba dil, hakaret ve kültürel açıdan duyarsız yorumlar kullanmasını en aza indirmek için çok çalıştığını” söylüyor. Kullanıcıların, verilerinin toplanmasını seçmeleri gerekecek ve eğer öyleyse, konuşmaları ve geri bildirimleri, genel AI araştırma topluluğu tarafından kullanılmak üzere Meta tarafından saklanacak ve daha sonra yayınlanacaktır.
BlenderBot 3’ün oluşturulmasına yardımcı olan Meta’da araştırma mühendisi Kurt Shuster, “Konuşma yapay zekasını geliştirebileceğimiz umuduyla demoda topladığımız tüm verileri halka açık bir şekilde yayınlamaya kararlıyız” dedi. Sınır.
Prototip AI sohbet robotlarını halka sunmak, tarihsel olarak teknoloji şirketleri için riskli bir hareket olmuştur. 2016 yılında Microsoft, Twitter’da halkla olan etkileşimlerinden öğrenen Tay adlı bir sohbet robotu yayınladı. Tahmin edilebileceği gibi, Twitter kullanıcıları kısa süre sonra Tay’a bir dizi ırkçı, antisemitik ve kadın düşmanı ifadeleri kusması için koçluk yaptı. Yanıt olarak Microsoft, 24 saatten kısa bir süre sonra botu çevrimdışına aldı.
Meta, Tay’ın arızalanmasından bu yana AI dünyasının çok değiştiğini ve BlenderBot’un Meta’nın Microsoft’un hatalarını tekrarlamasını engellemesi gereken her türlü güvenlik rayına sahip olduğunu söylüyor.
Facebook AI Research’te (FAIR) araştırma mühendisliği müdürü Mary Williamson çok önemli bir şekilde, Tay kullanıcı etkileşimlerinden gerçek zamanlı olarak öğrenmek için tasarlanırken, BlenderBot statik bir modeldir diyor. Bu, kullanıcıların bir konuşma sırasında söylediklerini hatırlama yeteneğine sahip olduğu anlamına gelir (ve hatta bir kullanıcı programdan çıkıp daha sonra geri dönerse bu bilgileri tarayıcı çerezleri aracılığıyla tutacaktır), ancak bu veriler yalnızca sistemi daha da geliştirmek için kullanılacaktır.
“Bu sadece benim kişisel görüşüm, ama bu [Tay] bölüm nispeten talihsiz, çünkü her kurumun araştırma için halka açık sohbet robotları çıkarmaktan korktuğu bu sohbet robotu kışını yarattı, ”diyor Williamson Sınır.
Williamson, günümüzde kullanılan çoğu sohbet robotunun dar ve görev odaklı olduğunu söylüyor. Örneğin, genellikle kullanıcılara önceden programlanmış bir diyalog ağacı sunan, sorgularını daraltan ve bunları işi gerçekten yapabilecek bir insan aracıya teslim etmeden önce daraltan müşteri hizmetleri botlarını düşünün. Asıl ödül, bir insanınki kadar özgür ve doğal bir sohbet gerçekleştirebilen bir sistem inşa etmektir ve Meta bunu başarmanın tek yolunun botların serbest ve doğal konuşmalar yapmasına izin vermek olduğunu söylüyor.
Williamson, “Yararsız şeyler söyleyen botlara karşı bu hoşgörü eksikliği, geniş anlamda talihsiz” diyor. “Ve yapmaya çalıştığımız şey, bunu çok sorumlu bir şekilde yayınlamak ve araştırmayı ilerletmek.”
Meta, BlenderBot 3’ü web’e koymanın yanı sıra temel alınan kodu, eğitim veri kümesini ve daha küçük model çeşitlerini yayınlama. Araştırmacılar, 175 milyar parametreye sahip en büyük modele erişim talep edebilir, burada bir form aracılığıyla.