David Gewirtz/ZDNet
Deepseek aniden kendini geçen hafta sonu IA dünyasının ruhuna dayattı. Üç önemli nedenden dolayı ayırt edilir:
- ABD’den değil, Çin’den bir AI Chatbot.
- Açık kaynak.
- Çalıştığımız büyük AI araçlarından çok daha az altyapı kullanıyor.
Amerikan hükümetinin Tiktok ile ilgili kaygıları ve Çin hükümetinin bu kurallara olası katılımı göz önüne alındığında, Çin’den yeni bir yapay zekanın ortaya çıkması başarısız olmayacak … ZDNET’ten Radhika Rajkumar, bu sorulara baktı. Makale Deepseek: Bu yüzden Openai’nin bu rakip Çin girişimine dikkat etmeliyiz.
Bu makalede siyasetten kaçınacağız. Bunun yerine, Deepseek’i gönderdim Her zamanki AI kodlama testleri serim. Aynı testlerde zaten on büyük dil modeli yaşadım.
Kısa cevap aşağıdaki gibidir: etkileyici, ama mükemmel değil. Konunun kalbine gidelim.
Test 1: Bir WordPress eklentisi yazın
Bu test aslında uzun zaman önce ChatGPT programlama yeteneklerine ilişkin ilk testimdi. Eşimin WordPress için çevrimiçi grubu için bir katılım cihazını yönetmesine yardımcı olacak bir eklentiye ihtiyacı vardı.
İhtiyaçları oldukça basitti. Eklenti, bir isim, satırdan bir isim listesi almak zorunda kaldı. Daha sonra isimleri sıralamak zorunda kaldı ve eğer kopyalar varsa, onları yan yana listelenmeyecek şekilde ayırdı.
Bunu onun için kodlamak için gerçekten zamanım yoktu, bu yüzden AI’da bu zorluğa başlamak için bir hevese karar verdim. Şaşırtıcı bir şekilde işe yaradı.
O zamandan beri, bu programlama becerilerini değerlendirmek için AI’ya geçmem gereken ilk test. AI, WordPress çerçevesinde kodu nasıl yapılandıracağınızı bilmeli ve hem kullanıcı arayüzünü hem de programın mantığını oluşturacak kadar net talimatları izlemelidir.

David Gewirtz/ZDNet tarafından ekran görüntüsü
Test ettiğim AI’nın sadece yarısı bu testi geçti. Bugün, Kazanan Deepseek’in çemberine bir tane ekleyebiliriz!

David Gewirtz/ZDNet tarafından ekran görüntüsü
Deepseek, kullanıcı arayüzünü oluşturdu ve programın mantığını tam olarak belirtildiği gibi izledi. Bu nedenle Deepseek dört testin ilkinde başarılı oldu.
Test 2: Bir karakter dizesi işlevini yeniden yazmak
Okuyucularımdan biri, bağış nöbet alanında dolar ve yüzü kavrayamadığından şikayet etti. Yazıldığı gibi, kodum yalnızca dolar sağlar. Bu nedenle test, AI’ya yazdığım rutini vermek ve hem dolar hem de yüz yetkilendirmesi için yeniden yazmasını istemektir.
Genellikle, AI daha sonra normal ifade ile bir doğrulama kodu oluşturur. Deepseek çalışan bir kod oluşturdu, ancak geliştirilebilir. Deepseek tarafından yazılan kod gereksiz yere uzun ve tekrarlayıcıydı. En büyük endişem, Deepseek doğrulamasının doğrulamayı iki ondalık sayıya kadar garanti etmesidir, ancak çok fazla sayıda girilirse (0.30000000000,0004 gibi), parsefloat fonksiyonunun (bir karakter dizesinin yüzen bir sayıya dönüşümü) kullanımının hiçbir açık bilgisi yoktur yuvarlamanın.
Deepseek’i tercih ederim, çünkü bu sorunların hiçbiri bir kullanıcı tarafından yürütüldüğünde programın engellemesine neden olmayacak ve önerilen çözüm beklenen sonuçları üretecektir.
Bu, Deepseek’e dört zaferden ikisini verir.
Test 3: Utanç verici bir hata bulun
Bu, bulmakta zorlandığım çok sıkıcı bir hatam olduğunda yapılan bir test. Bir kez daha, Chatgpt’in onu yönetip yönetemeyeceğini görmeye karar verdim.
Sorun şu ki, cevabın açık olmaması. Aslında, zorluk, hata mesajına dayanan bariz bir cevap olmasıdır. Ancak bariz cevap doğru cevap değil. Ben nöbet tutan tek kişi ben değildim ve düzenli olarak bazı AI şaşırtıyor.
Bu hatayı çözmek için, WordPress’in belirli API’sının nasıl çalıştığını anlamanız, kodun kendisinin hata mesajının ötesini görebilmeniz ve hatayı nerede bulacağınızı bilmeniz gerekir.
Deepseek de bu testle geçti, bu da dördüncü testi beklerken zaten üç başarı sağladı. Bu zaten Deepseek’i İkizler, Copilot, Claude ve Meta’nın önüne yerleştiriyor.
Test 4: Bir senaryo yazın
Ve bu tozu ısırmak için başka bir test. Bu zor bir testtir, çünkü AI üç ortam arasındaki etkileşimi anlamasını gerektirir: Applescript, Chrome Nesne Modeli ve Klavye Maestro adlı bir MAC betiği aracı.
Bu haksız testi nitelendirirdim, çünkü Klavye Maestro bir tüketici programlama aracı değil. Ancak Chatgpt, bu görevi kolaylıkla yerine getirdi ve sorunun hangi bir kısmının her bir araç tarafından ele alındığını anladı.
Ne yazık ki, Deepseek’in bu düzeyde bilgiye sahip olmadı. Görevi klavye maestro ve krom talimatları arasında bölmek zorunda olduğunu bilmiyordu. Ayrıca Applescript bilgisine sahipti.
Bu nedenle Deepseek üç doğru test ve başarısızlıkla bulunur.
Nihai Yansımalar
Deepseek’in Gmail gibi genel buluttan bir e -posta adresi kullanmak için ısrarının (işim alanıyla normal e -posta adresim yerine) sıkıcı olduğunu buldum. Ayrıca, bu testlerin istediğimden daha uzun süren duyarlılığı açısından bir dizi başarısızlığı vardı.
Bu makaleyi yazabileceğimden şüphe ettim, çünkü günün çoğu için kayıt olmaya çalışırken bu hatayı aldım:
Deepseek çevrimiçi hizmetleri son zamanlarda büyük ölçekli kötü niyetli saldırılara konu olmuştur. Hizmetin sürekliliğini sağlamak için kayıt geçici olarak telefon numaraları +86 ile sınırlıdır. Mevcut kullanıcılar her zamanki gibi bağlanabilir. Anlayışınız ve desteğiniz için teşekkür ederiz.
Sonra testleri bağlayabildim.
Deepseek, ürettiği kodla ilgili çok kare gibi görünüyor. Test 4’ün Applescript kodu hem yanlış hem de aşırı uzun sürdü. Test 2’nin düzenli test kodu doğruydu, ancak asimile olmayı çok daha kolay hale getirecek şekilde yazılmış olabilir.
Ancak, Deepseek’in İkizler, Copilot ve Meta’yı yenmesi gerçeğinden gerçekten etkilendim. Ancak eski GPT-3.5 seviyesinde gibi görünüyor, bu da kesinlikle iyileştirme için yer olduğu anlamına geliyor.
Diğer araçlardan çok daha hafif bir altyapı üzerinde çalışan yepyeni bir araç için, izlemek için bir AI olabilir.
Ne düşünüyorsun? Deepseek’i denedin mi? Programlama yardımı için AI kullanıyor musunuz? Aşağıdaki yorumlarda bize bildirin.
Kaynak : “Zdnet.com”

