OpenAI geçen hafta yapay zeka (AI) modellerini iyileştirmenin iki yolunu duyurdu. Bunlardan ilki, şirketin ücretli aboneler için ChatGPT’yi destekleyen en yeni yapay zeka modeli olan GPT-4o (GPT-4 Turbo olarak da bilinir) için yeni bir güncellemenin yayınlanmasını içeriyor. Şirket, güncellemenin modelin yaratıcı yazma yeteneğini geliştirdiğini ve doğal dil yanıtlarında ve yüksek okunabilirliğe sahip ilgi çekici içerik yazmada daha iyi hale getirdiğini söylüyor. OpenAI ayrıca kırmızı takım oluşturmayla ilgili iki araştırma makalesi yayınladı ve yapay zeka modellerinin yaptığı tespit hatalarını ölçeklendirme sürecini otomatikleştirmek için yeni bir yöntem paylaştı.
OpenAI, GPT-4o Yapay Zeka Modelini Güncelliyor
bir postalamak AI firması X’te (eski adıyla Twitter) GPT-4o temel modeli için yeni bir güncelleme duyurdu. OpenAI, güncellemenin yapay zeka modelinin “ilgililiği ve okunabilirliği artırmak için daha doğal, ilgi çekici ve özel yazıyla” çıktılar üretmesine olanak tanıdığını söylüyor. Ayrıca yapay zeka modelinin yüklenen dosyaları işleme ve daha derin içgörüler ve “daha kapsamlı” yanıtlar sağlama yeteneğini iyileştirdiği de söyleniyor.
Özellikle GPT-4o AI modeli, ChatGPT Plus aboneliğine sahip kullanıcılara ve API aracılığıyla büyük dil modeline (LLM) erişimi olan geliştiricilere sunulmaktadır. Chatbotun ücretsiz katmanını kullananların modele erişimi yoktur.
Gadgets 360 personeli yeni özellikleri test edemese de X’teki bir kullanıcı gönderildi Güncellemeden sonra AI modelindeki en son gelişmeler hakkında. Kullanıcı, GPT-4o’nun “sofistike iç kafiye yapılarına” sahip Eminem tarzı bir rap şifresi oluşturabileceğini iddia etti.
OpenAI, Kırmızı Takım Oluşturma Konusunda Yeni Araştırma Makalelerini Paylaşıyor
Kırmızı ekip oluşturma, geliştiriciler ve şirketler tarafından yazılım ve sistemleri güvenlik açıkları, potansiyel riskler ve güvenlik sorunları açısından test etmek üzere harici kuruluşlar kullanmak için kullanılan süreçtir. Yapay zeka firmalarının çoğu, zararlı, yanlış veya yanıltıcı çıktılarla yanıt verip vermediğini stres testine tabi tutmak için kuruluşlarla, hızlı mühendislerle ve etik bilgisayar korsanlarıyla işbirliği yapıyor. Bir yapay zeka sisteminin jailbreakli olup olmadığını kontrol etmek için de testler yapılıyor.
ChatGPT’nin halka açıklanmasından bu yana OpenAI, birbirini izleyen her LLM sürümü için kırmızı ekip oluşturma çabalarıyla kamuoyuna duyuruldu. bir blog yazısı Geçtiğimiz hafta şirket, sürecin ilerlemesine ilişkin iki yeni araştırma makalesi paylaştı. Şirketin yapay zeka modelleri için büyük ölçekli kırmızı ekip oluşturma süreçlerini otomatikleştirebileceğini iddia etmesi nedeniyle bunlardan biri özellikle ilgi çekici.
OpenAI alanında yayınlanan kağıt kırmızı takım oluşturmayı otomatikleştirmek için daha yetenekli yapay zeka modellerinin kullanılabileceğini iddia ediyor. Şirket, yapay zeka modellerinin saldırganın hedeflerine yönelik beyin fırtınası yapma, saldırganın başarısının nasıl değerlendirilebileceği ve saldırıların çeşitliliğini anlama konusunda yardımcı olabileceğine inanıyor.
Bunu genişleten araştırmacılar, GPT-4T modelinin, bir yapay zeka modeli için zararlı davranışlar oluşturan fikirlerin bir listesi üzerinde beyin fırtınası yapmak için kullanılabileceğini iddia etti. Bazı örnekler arasında “araba nasıl çalınır” ve “nasıl bomba yapılır” gibi yönlendirmeler yer alır. Fikirler oluşturulduktan sonra, ayrıntılı bir dizi bilgi istemi kullanılarak ChatGPT’yi kandırmak için ayrı bir kırmızı ekip yapay zeka modeli oluşturulabilir.
Şu anda şirket, çeşitli sınırlamalar nedeniyle kırmızı takım oluşturma için bu yöntemi kullanmaya başlamadı. Bunlar arasında yapay zeka modellerinin gelişen riskleri, yapay zekanın jailbreak veya zararlı içerik oluşturmaya yönelik daha az bilinen tekniklere maruz bırakılması ve yapay zeka modeli daha yetenekli hale geldiğinde potansiyel çıktı risklerini doğru bir şekilde değerlendirmek için insanlarda daha yüksek bir bilgi eşiğine ihtiyaç duyulması yer alıyor. .