OpenAI, GPT-4’ü eğitmek için bir milyon saatten fazla YouTube videosunu yazıya geçirdi

Son güncelleme: 7 Nisan 2024 01:25

Yakın zamanda, büyük üretken dil modelleri geliştiren şirketlerin, yapay zekalarını eğitmek için yeterli kalitede veriye sahip olmama sorunuyla karşı karşıya kaldıklarını bildirmiştik. OpenAI’nin YouTube sayesinde sorunu kısmen çözdüğü bildirildi.

DALL-E tarafından oluşturuldu

Şirket ayrıca GPT-4’ü eğitmek için Whisper ses transkripsiyon modelini oluşturdu ve sonunda bir milyon saatten fazla YouTube videosunu metne çevirdi. New York Times, OperaAI’nin bunun yasal bir gri alan olduğunun farkında olduğunu ancak yine de buna devam ettiğini söylüyor. Şirketin şu anda GPT-5’i eğitmek için aynı yöntemi kullanıyor olması oldukça muhtemel.

Kaynak, OpenAI’nin GPT-4 için zaten tüm yüksek kaliteli eğitim verileri rezervlerini, hatta 2021’de tükettiğini söylüyor.

genel-22