Yakın zamanda, büyük üretken dil modelleri geliştiren şirketlerin, yapay zekalarını eğitmek için yeterli kalitede veriye sahip olmama sorunuyla karşı karşıya kaldıklarını bildirmiştik. OpenAI’nin YouTube sayesinde sorunu kısmen çözdüğü bildirildi.
Şirket ayrıca GPT-4’ü eğitmek için Whisper ses transkripsiyon modelini oluşturdu ve sonunda bir milyon saatten fazla YouTube videosunu metne çevirdi. New York Times, OperaAI’nin bunun yasal bir gri alan olduğunun farkında olduğunu ancak yine de buna devam ettiğini söylüyor. Şirketin şu anda GPT-5’i eğitmek için aynı yöntemi kullanıyor olması oldukça muhtemel.
Kaynak, OpenAI’nin GPT-4 için zaten tüm yüksek kaliteli eğitim verileri rezervlerini, hatta 2021’de tükettiğini söylüyor.


