
IBM, 2,3 milyon mamografik görüntü üzerinde eğitilmiş, meme kanseri tanısı için uzmanlaşmış bir Watson modeli yaptı. Mikro-gerçekleştirmelerin tanınmasında uzmanlaşmış, 18 kat daha az parametreyle doğruluğunun% 98,7’sine (öğretmenin% 96,4’üne karşı) ulaşır. GPT-4’ten maltlı modelden türev, yasal sözleşmeleri riskli hükümlerin tanımlanmasında% 99,1 hassasiyetle analiz eder ve 450 bin yasal belgeye odaklanan bir eğitim sayesinde% 2,3 öğretmeni aşar.
Microsoft, Openai ve Meta’nın sahip oldukları ilan ettikleri dikkate alındığında, Deepseek’in bulguları sayesinde başka modeller de doğacak.
Dezavantajlar
“Damıtmanın ilginç bir uzlaşması var; Modelleri daha küçük yaparsanız, kaçınılmaz olarak yeteneğini azaltır, “diye açıklıyor Microsoft Research’ten Ahmed Awadallah, damıtılmış bir modelin e-postaları özetlemede çok etkili olabileceğini söyledi,” ama gerçekte hiçbir şeyde etkili olmayacak. Openai, şirketlerin yüksek düzeyde doğruluk ve güvenilirlik için daha fazla ödeme yapmak istedikleri yüksek zeka ve yüksek riskli faaliyetler için büyük dilsel modellerin hala gerekli olacağını iddia ediyor. Ve daha sonra daha küçük modellerde damıtılabilecek yeni beceriler keşfetmek için bu büyük modellere de ihtiyaç duyulacak.
Temel olarak, Deepseek’in başarısına rağmen, uzmanlar henüz eğitim verileri (kılavuzlar, otomatik, damıtılmış) için mükemmel bir karışım arayışının çözüldüğüne ikna olmadılar. Bu süreç paradoksal karmaşıklıklar getirir: bir yandan öğretmen, belirli görevler için insanlardan daha yüksek kalitede sözde makam üretebilir; Öte yandan, orijinal modelde bulunan yanlılığı veya sistematik hataları sürdürme riskiyle karşı karşıya.
Sonra dikkate alınması gereken bir telif hakkı teması var. Openai’ye göre, Deepseek modeli eğitmek için Openai modellerini damıttı ve hizmet şartlarına aykırı bir etkinlik. Openi, ancak rakibi bildirmek istemediğini ekledi; Aynı zamanda daha dikkatli olacak: Şimdi modelinin kullanımını izleyen ve bir rakibi ihraç etmek ve eğitmek için büyük miktarlarda veri ürettiğinden şüphelenen kullanıcılara erişimi kaldırabilecek ekipler var. Bunu tam olarak Deepseek tarafından kullanılan hesaplarla yaptı. Tamamen engellenmesi zor bir etkinlik olmaya devam ediyor. Şimdiye kadar damıtmanın öküzü kaçtı. Yol, birçok ve farklı modelin oluşturulması için daha çeşitli bir sınır için açıktır.

