Antropic, Claude 3.7 sonnet adlı yeni bir model yayınladı ve her zaman en son AI yetenekleriyle ilgilenirken, gerçekten gözümü çeken yeni “genişletilmiş” moddu. Openai’nin Chatgpt için O1 modelini nasıl piyasaya sürdüğünü hatırlattı. ChatGPT 4O modelini kullanarak bir pencere bırakmadan O1’e erişmenin bir yolunu sundu. “/Sebep” yazabilirsiniz ve AI chatbot bunun yerine O1 kullanır. Şu anda gereksiz, ancak uygulamada çalışıyor. Ne olursa olsun, her ikisinin de vaat ettiği daha derin, daha yapılandırılmış akıl yürütme, beni birbirlerine karşı nasıl yapacaklarını görmek istememi sağladı.
Claude 3.7’nin Genişletilmiş Modu, kullanıcılara hızlı, konuşma yanıtları ve derinlemesine, adım adım problem çözme arasında geçiş yapma seçeneği sunan hibrit bir akıl yürütme aracı olarak tasarlanmıştır. Cevabını vermeden önce isteminizi analiz etmek zaman alır. Bu, matematik, kodlama ve mantık için harika olur. Hız ve derinlik arasındaki dengeyi bile ince ayarlayarak, yanıtını düşünmek için bir zaman sınırı verir. Antropik, bunu sadece yüzey seviyesi tepkilerinin aksine, katmanlı, metodik problem çözme gerektiren gerçek dünya uygulamaları için daha yararlı hale getirmenin bir yolu olarak konumlandırır.
Claude 3.7’ye erişmek Claude Pro’ya bir abonelik gerektirir, bu yüzden aşağıdaki videodaki gösteriyi testim olarak kullanmaya karar verdim. Genişletilmiş düşünme moduna meydan okumak için Antropic, AI’dan Monty Hall problemi olarak bilinen popüler, vintage olasılık bulmacasını analiz etmesini ve açıklamasını istedi. Kendilerini matematikte iyi görenler bile, birçok insanı güdükleyen aldatıcı zor bir soru.
Kurulum basit: Bir oyun şovunda bulunuyorsunuz ve üç kapıdan birini seçmeniz isteniyor. Arkasında bir araba var; Diğerlerinin arkasında keçiler. Bir hevesle, antropik keçi yerine yengeçlerle gitmeye karar verdi, ancak prensip aynı. Seçiminizi yaptıktan sonra, her kapının arkasında ne olduğunu bilen ev sahibi, bir keçi (veya yengeç) ortaya çıkarmak için kalan iki kişiden birini açar. Şimdi bir seçeneğiniz var: Orijinal seçiminize bağlı kalın veya son açılmamış kapıya geçin. Çoğu insan bunun önemli olmadığını varsayar, ancak tersine, geçiş yapmak aslında 2/3 kazanma şansı verir, ilk tercihinize bağlı kalırken sizi sadece 1/3 olasılıkla bırakır.
Crabby Seçimleri
Genişletilmiş düşünme etkinken, Claude 3.7 sorunu açıklamak için ölçülü, neredeyse akademik bir yaklaşım benimsedi. Sadece doğru cevabı belirtmek yerine, altta yatan mantığı birden fazla adımda dikkatlice ortaya koydu ve ana bilgisayardan sonra olasılıkların neden bir yengeç ortaya çıkardığını vurguladı. Sadece kuru matematik terimleriyle de açıklanmadı. Claude, varsayımsal senaryolardan geçerek, olasılıkların tekrarlanan denemelerde nasıl oynandığını göstererek, anahtarlamanın neden her zaman daha iyi hareket olduğunu kavramanızı çok daha kolay hale getirdi. Yanıt acele değildi; Bir profesörün beni yavaş, kasıtlı bir şekilde geçmesi gibi hissettirdi, bu da ortak sezginin neden yanlış olduğunu gerçekten anladım.
Chatgpt O1 sadece bir ayrılık sundu ve sorunu iyi açıkladı. Aslında, bunu birden fazla form ve stilde açıkladı. Temel olasılıkla birlikte, oyun teorisi, anlatı görüşleri, psikolojik deneyim ve hatta bir ekonomik çöküşten de geçti. Bir şey varsa, biraz eziciydi.
Oynama
Yine de Claude’un genişletilmiş düşüncesinin yapabileceği hepsi bu değil. Videoda görebileceğiniz gibi, Claude, Monty Hall probleminin bir versiyonunu pencerede oynayabileceğiniz bir oyuna bile yapabildi. Chatgpt O1 ile aynı istemi denemek aynı şeyi yapmadı. Bunun yerine, Chatgpt, tarayıcımda kaydedebileceğim ve açabileceğim sorunun simülasyonu için bir HTML betiği yazdı. Aşağıda görebileceğiniz gibi işe yaradı, ancak birkaç adım attı.

Ne tür bir kod veya matematik üzerinde çalıştığınıza bağlı olarak kalitede neredeyse kesinlikle küçük farklılıklar olsa da, hem Claude’un genişletilmiş düşüncesi hem de ChatGPT’nin O1 modeli mantıksal sorunlara sağlam, analitik yaklaşımlar sunar. Claude’un sunduğu akıl yürütmenin zamanını ve derinliğini ayarlamanın avantajını görebiliyorum. Bununla birlikte, gerçekten acele ediyorsanız veya alışılmadık derecede ağır bir analiz talep etmedikçe, ChatGPT çok fazla zaman almıyor ve düşünmesinden çok fazla içerik üretiyor.
Sorunu sohbet içinde bir simülasyon olarak oluşturma yeteneği çok daha dikkat çekicidir. Gerçek simülasyon muhtemelen ChatGpt tarafından yazılan HTML’ye çok benzer bir kod kullansa bile, Claude’u daha esnek ve güçlü hissettirir.


