Yalnızca dört ay önce Amazon tarafından satın alınan ve kurucular Dario ve Daniela Amodei tarafından yönetilen yeni girişim Anthropic, Claude 3’ü piyasaya sürdü. Geliştiricilere göre, o zamanlar en gelişmiş sürüm olan Opus, “Neredeyse insani düzeyde anlayış ve anlayış” sergiliyordu. karmaşık görevlerde akıcılık, yapay zeka sistemlerini değerlendirmek için kullanılan değerlendirme kriterlerinin çoğunda benzerlerinden daha iyi performans.” Today Anthropic – 2024 itibarıyla 850 milyon doların üzerinde gelir elde edecek – birkaç gün önce duyurulan Sonnet’in yeni 3.5 sürümüyle çıtayı yükseltiyor. Bu, San Francisco’daki startup tarafından açıklanana göre, dahili olarak gerçekleştirilen bazı testlerde rakip şirketlerin modellerinin elde ettiği sonuçları ve elde edilen sonuçları geride bırakan yeni büyük dil modeli veya LLM’dir (Büyük Dil Modeli). Claude 3 Opus adlı üst düzey modeliyle.

Claude 3.5 Sonnet nasıl çalışır ve neler yapabilir: geçilen testler

Testlere göre Claude 3.5 Sonnet, dokuz genel kıyaslamanın yedisinde ve beş görsel kıyaslamanın dördünde GPT-4o, Gemini 1.5 Pro ve Meta’nın Llama 3 400B’sinden daha iyi performans gösteriyor gibi görünüyor. Yine şirkete göre bu, kod yazma ve çevirme, çok aşamalı iş akışlarını yönetme, diyagram ve grafikleri yorumlama ve resimlerden metin yazma konularında önemli bir gelişme gösterecek. Görünüşe göre Claude aynı zamanda nüansları, mizahı ve hatta karmaşık talimatları kavramada daha iyi ve Anthropic’in “doğal ve ilişkilendirilebilir” olarak adlandırdığı bir üslup kullanarak yüksek kaliteli içerik yazma konusunda oldukça çevik.

Anthropic, yeni LLM’yi teste tabi tutarken, modeli bir teste tabi tuttuğunu, bunun da hataları düzelteceğini veya açık kaynak kod tabanına özellikler ekleyeceğini söyledi. Claude 3.5 Sonnet, Claude 3 Opus’un elde ettiği %38’lik başarıya kıyasla sorunların %64’ünü çözmeyi başardı.

«Claude 3.5 Sonnet, şimdiye kadarki en güçlü görüş modelimizdir ve standart görüş kriterlerinde Claude 3 Opus’u geride bırakır. Bu çığır açıcı iyileştirmeler, tabloları ve grafikleri yorumlamak gibi görsel muhakeme gerektiren görevlerde en çok fark edilir. Claude 3.5 Sonnet ayrıca perakende, lojistik ve finansal hizmetler için önemli bir özellik olan kusurlu görüntülerden metni doğru bir şekilde kopyalayabiliyor; burada yapay zeka yalnızca metinden ziyade bir görüntü, grafik veya illüstrasyondan daha fazla bilgi toplayabiliyor.” Anthropic açılışta şunları söyledi: Claude 3.5 Sonnet, Claude 3 Opus’tan iki kat daha hızlı çalıştığı için müşteri desteği gibi karmaşık görevlerde kullanım için mükemmeldir.

Claude 3.5 Sonnet duyurusuyla aynı zamanda Anthropic, kullanıcıların modelle etkileşim kurma biçimini genişleten yeni bir özellik olan Artifacts’i de (Claude.ai’de mevcut) sundu. Uygulamada, ikincisini örneğin metin belgeleri, e-postalar, web sitesi projeleri, kod parçaları vb. içerik oluşturmak için sorguladığınızda, çıktılar modelle yapılan sohbetin yanında özel bir pencerede gösterilir. Bu şekilde kullanıcı, doğrudan uygulamada değiştirilmesine olanak tanıyan dinamik bir çalışma alanıyla etkileşime girebilir. Anthropic’e göre «Claude size bir e-posta yazarsa, e-postayı bir metin düzenleyiciye kopyalamak yerine Claude uygulamasında düzenleyebilirsiniz. Bu küçük ama akıllı bir özellik. Claude’un konuşabilen bir yapay zekadan işbirliğine dayalı bir çalışma ortamına doğru evrimini gösteren bir önizleme özelliği.”



genel-18