Geçtiğimiz hafta Anthropic (Amazon’dan 4 milyar dolarlık yatırım aldı) şunu duyurdu: Claude 3.5 Sonnet artık veri analizini destekliyor.
Anthropic’in duyurduğu özellik, ChatGPT’nin gelişmiş veri analizine benziyor. Aradaki fark, Claude’un analiz aracının ücretsiz kullanıcılar dahil herkesin kullanımına açık olmasıdır.
ChatGPT’nin gelişmiş veri analizi yalnızca ayda 20 ABD doları veya daha fazla ödeme yapan Plus ve Enterprise hesap kullanıcıları tarafından kullanılabilir.
Claude kodunu JavaScript’te, ChatGPT’yi Python’da yazıyor
Hem ChatGPT Plus hem de Claude, verileri analiz eden ve işleyen kod parçacıkları yazıp çalıştırarak veri analizlerini gerçekleştirir.
Önemli bir fark, Claude’un kodunu JavaScript’te yazarken ChatGPT’nin kodunu Python’da yazmasıdır.
Bu seçimler ilginç.
Makine öğrenimi için Python, görselleştirme için JavaScript
Python, Pandas, NumPy ve SciPy gibi zengin bir sayısal analiz kütüphaneleri ekosistemine sahiptir.
JavaScript’in de zengin bir ekosistemi var ancak veri ve yapay zeka teklifleri Python’unki kadar kapsamlı değil.
Python, TensorFlow, PyTorch ve Keras gibi çerçevelerle makine öğrenimi ve yapay zeka alanında çok güçlüdür. Python aynı zamanda büyük veri için de mükemmel destek sağlar, ancak göreceğiniz gibi Claude’un mevcut analiz aracındaki hiçbir şey orta veri olarak kabul edilemez.
Öte yandan JavaScript, web sayfalarındaki verileri görselleştirmek için mükemmel bir şekilde uygundur. Anthropic çözümü React’ı kullanıyor ancak bilgi sunmak için D3.js ve chart.js gibi harika görselleştirme kütüphaneleri de var.
Bu tür görselleştirme araçlarıyla, Claude kullanarak oluşturduğum pasta grafiklerinin belirli kategoriler için veri etiketlerini kesme eğiliminde olmasını tuhaf buldum.
Claude’dan veriyi işlemesini istediğinizde size sonucunu verir ama aynı zamanda bu veri analizini gerçekleştirmek için oluşturduğu temel kodu da görmenizi sağlar. İşte bir örnek.
Ekran görüntüsü: David Gewirtz/ZDNET
Claude’un kullanım sınırları
Analitik becerilerini test etmek için Claude’u kullanmaya karar verdim. Kendimi ücretsiz sürümle sınırladım. Claude’un SSS’sine göre, aylık 20 ABD doları tutarındaki Pro sürümü, kullanım sınırlarını beş kat artırıyor.
Ekran görüntüsü: David Gewirtz/ZDNET
Bu muhtemelen ciddi kullanım için gerekli, çünkü yaklaşık 20 dakikalık testten sonra kesintiye uğradım.
Ekran görüntüsü: David Gewirtz/ZDNET
Yeni bir sohbet açmayı denedim ama başarılı olamadım. Bir saat bekledikten sonra daha fazla soru sorabildim.
Verileri temizlemek için kod yazın
Claude’un veri analizi yeteneklerini test etmek için siteye gittim data.gov. bir indirdim ABD Sosyal Güvenlik İdaresi veri kümesi Sosyal güvenlik kartı başvurularından türetilen bebek isimlerinin kullanımına ilişkin.
Bu veriler bir ZIP dosyası biçimindeydi. 1880’den 2023’e kadar adlara ilişkin verileri içeren 145 CSV (virgülle ayrılmış değer) metin dosyasını, yılda bir dosya olacak şekilde çıkardım.
İlk önce tüm dosyaları seçmeyi ve bunları grup olarak Claude’a aktarmayı denedim. Ancak Claude aynı anda yalnızca beş dosyayı içe aktarabilir.
Ekran görüntüsü: David Gewirtz/ZDNET
Verileri temizleme istemi
Bu yüzden tüm verileri içeren tek bir dosya oluşturacak bir komut dosyası yazmaya karar verdim. Sorun, her bir dosyanın alanlardan birinde yılı içermemesiydi. Bu nedenle betiğim, tüm dosyalar için dosyanın her kaydına dosya adının yılını eklemek zorunda kaldı.
Kendimi kodlamak yerine Claude’dan bunu benim için yapmasını istedim. İşte istem:
“Macintosh’ta 145 metin dosyasını hızlı bir şekilde birleştirmem gerekiyor. Her dosya adı, yob harflerinden ve ardından yılı belirten dört rakamdan ve ardından .txt’den oluşur. Dosyaların kendileri virgülle ayrılmış değerlerdir. Her dosya için, İlgili dosyanın her satırına dosya adında yer alan yılı ve ardından virgül ekleyin. Daha sonra 145 dosyanın tamamını tek bir ana dosyada birleştirmem gerekiyor. Bunu hızlı bir şekilde nasıl yapabilirim?
Hile yapacak gibi görünen bir kabuk betiği oluşturdum.
Ekran görüntüsü: David Gewirtz/ZDNET
Scripti kaydettim ve çalıştırdım.
Ekran görüntüsü: David Gewirtz/ZDNET
Claude’un indirme boyutu sınırına dikkat edin!
Çalıştı ve tam olarak istediğimi yaptı. Bu kabuk betiğini çalıştırmanın sonucu 37 MB’lık bir dosyaydı. Ne yazık ki, bu 37 MB’ın Claude tarafından dayatılan 30 MB indirme sınırını aştığını hemen fark ettim. Çok daha küçük bir veri kümesine ihtiyacım vardı.
Her yıla ait nominal verileri kullanmak yerine, on yılda bir tek bir dosyadaki nominal verileri kullanarak veri kümemin boyutunu orijinal boyutun %10’una düşüreceğimi düşündüm. Bu yüzden istemimi değiştirdim ve Claude’a geri gönderdim.
“Macintosh’ta 145 metin dosyasını hızlı bir şekilde birleştirmem gerekiyor. Her dosya adı, yob harflerinden ve ardından yılı belirten dört rakamdan ve ardından .txt’den oluşur. Dosyaların kendileri virgülle ayrılmış değerlerdir. Adı ile biten her dosya için 0.txt’de, ilgili dosyanın her satırına dosya adında yer alan yılı ve ardından virgül ekleyin. Daha sonra 0.txt ile biten tüm dosyaları tek bir ana dosyada birleştirmelisiniz. yap.
İşe yaradı. Ve 3.9 MB’lık bir dosyam var.
Genel olarak Claude 3.5 Sonnet’in kodlama çalışmalarından oldukça memnunum. Ne yazık ki test sürecinin sorunsuz geçen son kısmıydı.
Claude’da ChatGPT’den daha fazla sınır var
Şimdi Claude’daki veri analizine bakalım. Ne yazık ki Claude’un alabileceği veri miktarı oldukça sınırlı görünüyor. Claude şunu belirtir: Pro sürümünün “ücretsiz hizmetimizden en az 5 kat daha fazla kullanıma” izin verdiğini ve “konuşmalarınız nispeten kısaysa, her 5 saatte en az 45 mesaj göndermeyi bekleyebilirsiniz”.
Fazla değil. Claude beş dosya ve 30 MB yükleyebileceğinizi söylese de, 3,9 MB’lık birleşik dosyamın uzunluk sınırının %9124 üzerinde olduğunun kabul edildiğini gördüm. Bu dosya 219.181 kayıt içermektedir.
Ekran görüntüsü: David Gewirtz/ZDNET
Elbette. Bu yüzden bir yıl boyunca bir dosyayı denedim. yob2020.txt dosyası yalnızca 561 KB olup yalnızca 31.550 kayıt içermektedir. Bu dosya görünüşe göre Claude tarafından belirlenen uzunluk sınırlarını %1239 oranında aşıyor.
Ekran görüntüsü: David Gewirtz/ZDNET
Claude veri analizini yaklaşık 25 karakterden oluşan yaklaşık 2.000 satırla sınırlandırıyor
Biraz matematik yaparsak ve mesaj kullanım sınırlarına ulaşmadığınızı varsayarsak, Claude veri analizini her biri yaklaşık 25 karakterden oluşan yaklaşık 2.000 satırla sınırlıyor gibi görünüyor.
Bunu ChatGPT Plus ile karşılaştıralım.
Kabul ediyorum, Claude’un ücretsiz sürümünü kullanıyorum, ancak Claude Pro 5X kapasite sunuyorsa, (şirket katı sınırlar sağlamadığı için) Claude Pro’nun 25 karakterlik yaklaşık 10.000 satıra kadar maksimuma çıkacağını genelleyebiliriz.
Buna karşılık ChatGPT Plus’a satır başına ortalama 50 karakter olacak şekilde 69.215 kayıt girdim ve çok iyi çalıştı. Uygulamalarımı kaldıran kullanıcıların yorumlarından oluşan 22.797 kayıttan oluşan bir veri kümesini ChatGPT Plus’a aktardım. Ve sorunsuz çalıştı. Ayrıca ChatGPT Plus’a 170.000 satırın üzerinde 3D yazıcı G kodundan oluşan iki dosyayı da tanıttım. Ve çok iyi çalıştı.
ChatGPT Plus’ın veri analizinin gerçekten yararlı olduğunu ve verimliliğin arttığını gördüm.
Claude’un veri analizi testi
O zamandan bu yana yaklaşık otuz veri kümesi indirdim data.gov Claude’un incelemesine yetecek kadar küçük bir tane bulmadan önce. Bu bir Sahiplendirilebilir evcil hayvanlara ilişkin Kasım 2020 veri kümesi Derwood, Maryland’deki Montgomery County Hayvan Hizmetleri ve Evlat Edinme Merkezi’nden.
Bu veri kümesinde her biri yaklaşık 190 karakterden oluşan 85 kayıt bulunmaktadır. Bakalım bize neler öğretebilecek?
Claude, “Bu veriler hakkında bana ne söyleyebilirsin?” sorusuna en yaygın evcil hayvan türünü (en küçük, en büyük veya en küçük) belirledi. Claude, en yaygın evcil hayvan türünü (köpekler), en yaygın yeniden barındırma türlerini (sahibinin terk edilmesi ve sonra başıboş dolaşması – bu çok üzücü), dikkate değer eğilimleri ve benzersiz özellikleri (Molly yaygın bir isimdir) belirledi.
Ekran görüntüsü: David Gewirtz/ZDNET
Hayvanların dağılımını gösteren pasta grafiği istedim. Bana ana hayvan türlerini gösteren ancak çubuk grafiğin neredeyse %50’sinde “Diğer” ifadesini bırakan bunu verdi.
Ekran görüntüsü: David Gewirtz/ZDNET
Claude ile veri görselleştirme sorunu
Bu “Diğer” kategorisinin neyi temsil ettiğini bilmek istedim. “Diğer” kategorisinin yüzde 30’unun tropikal balıklardan oluşması fikrinde biraz dokunaklı bir şey var.
Ekran görüntüsü: David Gewirtz/ZDNET
Bu tabloya ve hemen üstündeki tabloya bir bakın. Görünmeleri için yeterli alan olmasına rağmen her iki grafikte de etiketlerin kesildiğine dikkat edin. Yaklaşık %30’unun tropik balık olduğunu biliyorum ama tam yüzdeyi bilmiyorum çünkü sadece “3” yazıyor.
JavaScript mükemmel grafik kitaplıklarına sahiptir. Anthropic’in, özellikle manzara modunda, grafik verilerini tam olarak temsil edecek şekilde çıktıyı düzenleyebileceğini düşünüyorum.
Sonuç olarak, bu çılgınca değil
Claude’un veri analizi özelliklerinin ChatGPT Plus ile aynı seviyede olacağını gerçekten umuyordum. Her ne kadar Claude’un ücretsiz sürümü ChatGPT Plus’ın yapabildiklerinin yalnızca beşte birini yapsa da ben bir aboneliğe kaydolabilirdim.
Verilerimi birden fazla analiz aracına gönderip sonuçları karşılaştırma fikrini gerçekten çok seviyorum. Tek başına bu bile yıllık 240 dolarlık ek yapay zeka faturasına kaydolmamı haklı çıkarıyordu.
Ancak yukarıdaki tahminlerimden açıkça görüldüğü gibi, Claude Pro sürümü daha önce başarıyla ChatGPT Plus’a beslediğim en küçük veri kümelerini bile işleyemedi, yatırım kesinlikle buna değmeyecek gibi görünüyor.
Yorum yapmak için Anthropic’e ulaştım ancak henüz yanıt alamadım. Şirket yanıt verirse bu makaleyi yorumlarıyla güncelleyeceğim.
Bu arada ne düşünüyorsun? ChatGPT Plus’ta gelişmiş veri analizini kullandınız mı? Claude veya ChatGPT kullanıcısı mısınız? ChatGPT yerine ne zaman Claude kullanırsınız veya kullanmayı düşünürsünüz? Aşağıdaki yorumlarda bize bildirin.