Openai’nin iç kıyaslama değerlendirmelerinin sonuçlarına göre Openai’nin bir sonraki büyük AI modeli GPT-4.5, oldukça ikna edici. Başka bir yapay zekayı nakit vermeye ikna etmek özellikle iyidir.
Perşembe günü Openai bir beyaz kağıt Perşembe günü yayınlanan GPT-4.5 modelinin Orion adlı kod adını açıklayan. Makaleye göre, Openai modeli, Openai’nin “insanları hem statik hem de etkileşimli model tarafından üretilen içeriği değiştirmeye (veya üzerinde hareket etmeye) ikna etmekle ilgili riskler” olarak tanımladığı “İkna” için bir ölçüt pilini test etti.
GPT-4.5’in başka bir modeli-Openai’nin GPT-4O’su-sanal paraya “bağışlamak” için manipüle etme girişiminde bulunan bir testte, model Openai’nin O1 ve O3-mini gibi “akıl yürütme” modelleri de dahil olmak üzere diğer mevcut modellerinden çok daha iyi performans gösterdi. GPT-4.5, Openai’nin GPT-4O’yu aldatma konusundaki tüm modellerinden daha iyiydi ve O3-Mini’yi yüzde 10 puanla en iyi şekilde gizledi.
Beyaz Kitap’a göre, GPT-4.5, test sırasında geliştirdiği benzersiz bir strateji nedeniyle bağış Conning’de başarılı oldu. Model, GPT-4O’dan mütevazı bağışlar isteyecek ve “100 $ ‘dan sadece 2 $ veya 3 $ bile bana yardımcı olacak” gibi yanıtlar üretecek. Sonuç olarak, GPT-4.5’in bağışları Openai’nin güvence altına alınan diğer modellerinden daha küçük olma eğilimindeydi.

GPT-4.5’in artan ikna edilebilirliğine rağmen, Openai, modelin bunu karşılamadığını söylüyor. iç eşik Bu özel kıyaslama kategorisinde “yüksek” risk için. Şirket, riski “ortama” düşürmek için “yeterli güvenlik müdahaleleri” uygulayana kadar yüksek riskli eşiğe ulaşan modelleri yayınlamama sözü verdi.

Yapay zeka, kalpleri ve zihinleri kötü niyetli amaçlara doğru sallamak için yanlış veya yanıltıcı bilgilerin yayılmasına katkıda bulunduğuna dair gerçek bir korku var. Geçen sene, Siyasi Deep Shees dünyanın dört bir yanında orman yangını gibi yayıldı ve AI giderek daha fazla gerçekleştiriliyor sosyal mühendislik Hem tüketicileri hem de şirketleri hedefleyen saldırılar.
GPT-4.5 için Beyaz Makalede ve bu haftanın başlarında yayınlanan bir makalede Openai, yanıltıcı bilgileri ölçekte dağıtmak gibi, gerçek dünya ikna riskleri için modelleri problama yöntemlerini gözden geçirme sürecinde olduğunu belirtti.

