Damıtma, yeni nesil modellerin kapılarını açan yöntemdir

Son güncelleme: 7 Mart 2025 01:23

IBM, 2,3 milyon mamografik görüntü üzerinde eğitilmiş, meme kanseri tanısı için uzmanlaşmış bir Watson modeli yaptı. Mikro-gerçekleştirmelerin tanınmasında uzmanlaşmış, 18 kat daha az parametreyle doğruluğunun% 98,7’sine (öğretmenin% 96,4’üne karşı) ulaşır. GPT-4’ten maltlı modelden türev, yasal sözleşmeleri riskli hükümlerin tanımlanmasında% 99,1 hassasiyetle analiz eder ve 450 bin yasal belgeye odaklanan bir eğitim sayesinde% 2,3 öğretmeni aşar.

Microsoft, Openai ve Meta’nın sahip oldukları ilan ettikleri dikkate alındığında, Deepseek’in bulguları sayesinde başka modeller de doğacak.

Dezavantajlar

“Damıtmanın ilginç bir uzlaşması var; Modelleri daha küçük yaparsanız, kaçınılmaz olarak yeteneğini azaltır, “diye açıklıyor Microsoft Research’ten Ahmed Awadallah, damıtılmış bir modelin e-postaları özetlemede çok etkili olabileceğini söyledi,” ama gerçekte hiçbir şeyde etkili olmayacak. Openai, şirketlerin yüksek düzeyde doğruluk ve güvenilirlik için daha fazla ödeme yapmak istedikleri yüksek zeka ve yüksek riskli faaliyetler için büyük dilsel modellerin hala gerekli olacağını iddia ediyor. Ve daha sonra daha küçük modellerde damıtılabilecek yeni beceriler keşfetmek için bu büyük modellere de ihtiyaç duyulacak.

Temel olarak, Deepseek’in başarısına rağmen, uzmanlar henüz eğitim verileri (kılavuzlar, otomatik, damıtılmış) için mükemmel bir karışım arayışının çözüldüğüne ikna olmadılar. Bu süreç paradoksal karmaşıklıklar getirir: bir yandan öğretmen, belirli görevler için insanlardan daha yüksek kalitede sözde makam üretebilir; Öte yandan, orijinal modelde bulunan yanlılığı veya sistematik hataları sürdürme riskiyle karşı karşıya.

Sonra dikkate alınması gereken bir telif hakkı teması var. Openai’ye göre, Deepseek modeli eğitmek için Openai modellerini damıttı ve hizmet şartlarına aykırı bir etkinlik. Openi, ancak rakibi bildirmek istemediğini ekledi; Aynı zamanda daha dikkatli olacak: Şimdi modelinin kullanımını izleyen ve bir rakibi ihraç etmek ve eğitmek için büyük miktarlarda veri ürettiğinden şüphelenen kullanıcılara erişimi kaldırabilecek ekipler var. Bunu tam olarak Deepseek tarafından kullanılan hesaplarla yaptı. Tamamen engellenmesi zor bir etkinlik olmaya devam ediyor. Şimdiye kadar damıtmanın öküzü kaçtı. Yol, birçok ve farklı modelin oluşturulması için daha çeşitli bir sınır için açıktır.

genel-18

ETİKETLENDİ:Açan damıtma Kapılarını modellerin nesil Yeni yöntemdir

Bu Makaleyi Paylaş

Önceki Makale Akhil Akkineni’nin ajanı Sony Liv’de OTT sürümü için hazırlandı: Bilmeniz gereken her şey

Sonraki Makale

Dış gezegenlerin oluşumuna yeni bir bakış, büyüme oranlarının yerleşik teorilerini çürütüyor

Damıtma, yeni nesil modellerin kapılarını açan yöntemdir

Dezavantajlar

Sanal Medya

Son Eklenenler

Kendi Fiziksel Oyun Kartuşlarını Üreten PC Oyun Yazarından Yenilikçi Proje

CDC’nin Cyclospora Laboratuvarı: Personel Azalması Tehlike Arttırıyor!

ASML, Low-NA EUV araçlarının fiyatlarını artırmayı hedefliyor

Laravel’de XSS Önleme — Neden {!! !!} Güvenli ile Hacklenmiş Arasındaki Sınırdır

2000 Mules Ekibi, Seçim Entrikalarını Yeniden İşliyor: Yeni Film Geliyor!

Vertu’nun yöneticilerden 6,880 dolara AI ajansı talebi ve performansı

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer