Bu haftanın başlarında, iyi finanse edilen bir Çin yapay zeka laboratuvarı olan DeepSeek, popüler kriterlerde birçok rakibi geride bırakan “açık” bir yapay zeka modeli yayınladı. DeepSeek V3 modeli büyük ama etkilidir; kodlama ve makale yazma gibi metin tabanlı görevleri kolaylıkla yerine getirir.
Aynı zamanda ChatGPT olduğunu düşünüyor gibi görünüyor.
Gönderiler Açık X – ve TechCrunch’ın kendi testleri – DeepSeek V3’ün kendisini OpenAI’nin yapay zeka destekli sohbet robotu platformu ChatGPT olarak tanımladığını gösteriyor. Ayrıntıları sorulduğunda DeepSeek V3, bunun OpenAI’nin 2023’te piyasaya sürülen GPT-4 modelinin bir versiyonu olduğu konusunda ısrar ediyor.
Bu aslında bugün itibariyle çoğalıyor. DeepSeekV3, 8 nesilden 5’inde ChatGPT (v4) olduğunu iddia ederken DeepSeekV3 olduğunu yalnızca 3 kez iddia ediyor.
Size bazı eğitim veri dağıtımları hakkında kabaca bir fikir verir. https://t.co/Zk1KUppBQM pic.twitter.com/ptIByn0lcv
— Lucas Beyer (bl16) (@giffmana) 27 Aralık 2024
Sanrılar derinlere uzanır. DeepSeek V3’e DeepSeek’in API’si hakkında bir soru sorarsanız, bu size nasıl kullanılacağına dair talimatlar verecektir OpenAI’ler API’dir. DeepSeek V3 bile aynı şeyleri söylüyor şakalar GPT-4 gibi — can alıcı noktalara kadar.
Peki neler oluyor?
ChatGPT ve DeepSeek V3 gibi modeller istatistiksel sistemlerdir. Milyarlarca örnek üzerinde eğitim alarak, tahminlerde bulunmak için bu örneklerdeki kalıpları öğrenirler; örneğin bir e-postadaki “kime” ifadesinin genellikle “ilgili olabilir” ifadesinden önce gelmesi gibi.
DeepSeek, DeepSeek V3’ün eğitim verilerinin kaynağı hakkında pek bir açıklama yapmadı. Ama var kıtlık yok ChatGPT aracılığıyla GPT-4 tarafından oluşturulan metni içeren herkese açık veri kümelerinin sayısı. DeepSeek V3 bunlar üzerinde eğitilmiş olsaydı, model GPT-4’ün bazı çıktılarını ezberlemiş olabilir ve şimdi bunları kelimesi kelimesine tekrarlıyor olabilir.
King’s College London’da yapay zeka konusunda uzmanlaşmış araştırma görevlisi Mike Cook, TechCrunch’a “Açıkçası, model bir noktada ChatGPT’den ham yanıtlar alıyor, ancak bunun nerede olduğu belli değil” dedi. “‘Kazara’ olabilir… ama ne yazık ki, kendi modellerini diğer modellerin çıktıları üzerinde doğrudan eğiterek bilgilerini geri almaya çalışan insanların örneklerini gördük.”
Cook, rakip yapay zeka sistemlerinden gelen çıktılar üzerinde model eğitimi uygulamasının model kalitesi açısından “çok kötü” olabileceğini, çünkü halüsinasyonlara ve yukarıdaki gibi yanıltıcı yanıtlara yol açabileceğini belirtti. Cook, “Fotokopinin fotokopisini çekmek gibi, giderek daha fazla bilgi ve gerçeklikle bağlantımızı kaybediyoruz” dedi.
Bu durum aynı zamanda söz konusu sistemlerin hizmet şartlarına da aykırı olabilir.
OpenAI’nin şartları, ChatGPT müşterileri de dahil olmak üzere ürünlerinin kullanıcılarının, OpenAI’nin kendi modelleriyle rekabet eden modeller geliştirmek için çıktıları kullanmasını yasaklıyor.
OpenAI ve DeepSeek yorum taleplerine hemen yanıt vermedi. Ancak OpenAI CEO’su Sam Altman, şöyle görünen bir paylaşım yaptı: kazmak X Friday’de DeepSeek ve diğer rakiplerde.
Altman, “Çalıştığını bildiğiniz bir şeyi kopyalamak (nispeten) kolaydır” diye yazdı. “Yeni bir şey yapmak son derece zordur, risklidir ve işe yarayıp yaramayacağını bilmediğiniz zaman zordur.”
Kabul edelim ki DeepSeek V3, kendisini yanlış tanımlayan ilk model olmaktan çok uzak. Google’ın Gemini’si ve diğerleri Bazen rakip modeller olduklarını iddia ediyorlar. Örneğin, Mandarin, Gemini dilinde istendiğinde diyor Bunun Çinli şirket Baidu’nun Wenxinyiyan chatbot’u olduğunu söyledi.
Bunun nedeni, yapay zeka şirketlerinin eğitim verilerinin büyük kısmını sağladığı web’in giderek daha da yaygınlaşmasıdır. çöp yapay zeka ile eğim. İçerik çiftlikleri içerik oluşturmak için yapay zekayı kullanıyor tıklama tuzağı. Botlar akın ediyor Reddit Ve X. Tek tek tahmin etmek2026 yılına kadar web’in %90’ı yapay zeka tarafından oluşturulabilir.
Bu “kirlenme”, deyim yerindeyse, bunu yaptı oldukça zor AI çıktılarını eğitim veri kümelerinden kapsamlı bir şekilde filtrelemek için.
DeepSeek’in DeepSeek V3’ü doğrudan ChatGPT tarafından oluşturulan metin üzerinde eğitmiş olması kesinlikle mümkündür. Google bir zamanlar sanık sonuçta aynısını yapmak.
Kâr amacı gütmeyen AI Now Enstitüsü’nün baş yapay zeka bilimcisi Heidy Khlaaf, mevcut bir modelin bilgisinin “damıtılmasından” elde edilen maliyet tasarruflarının, riskler ne olursa olsun geliştiriciler için cazip olabileceğini söyledi.
Khlaaf, “İnternet verileri artık yapay zeka çıktılarıyla dolu olsa bile, yanlışlıkla ChatGPT veya GPT-4 çıktıları üzerinde eğitim alan diğer modeller, mutlaka OpenAI özelleştirilmiş mesajlarını anımsatan çıktılar göstermeyebilir” dedi. “DeepSeek’in damıtma işlemini kısmen OpenAI modellerini kullanarak gerçekleştirmesi durumunda bu şaşırtıcı olmaz.”
Bununla birlikte, çok sayıda ChatGPT/GPT-4 verisinin DeepSeek V3 eğitim setine girmiş olması daha olasıdır. Bu, öncelikle modelin kendini tanımlama konusunda güvenilemeyeceği anlamına geliyor. Ancak daha endişe verici olan, DeepSeek V3’ün GPT-4’ün çıktılarını eleştirmeden özümseyip yineleyerek modelin bazı özelliklerini daha da kötüleştirme olasılığıdır. önyargılar Ve kusurlar.
TechCrunch’ın yapay zeka odaklı bir haber bülteni var! Buradan kaydolun Her Çarşamba gelen kutunuza almak için.

