Birçok şirketin yapay zekalarını eğitmek için YouTube video transkripsiyon verilerine güvendiğini ortaya koyan bir raporun ardından Apple, tartışmalı Pile verileriyle eğitilen OpenELM’in kullanımını ve planlarını netleştirmek için bir adım attı.
Apple, Pile’ı sağlayan şirket EleutherAI’nin, sosyal video platformunun veri kullanım politikalarına aykırı bir eylemde bulunarak YouTube Altyazıları veri setini kullandığını ayrıntılarıyla anlatan raporu okuduktan sonra TechRadar ile iletişime geçti.
Apple, YouTube verileri konusuna doğrudan değinmese de içerik üreticilerinin ve yayıncılarının haklarına olan bağlılığını yineledi ve web sitelerine verilerinin Apple Intelligence’ı eğitmek için kullanılmamasını sağlama seçeneği sunduğunu ekledi. Apple, WWDC 2024’te bu özelliği duyurmuştu ve bu özelliğin iOS 18’de gelmesi bekleniyor.
Şirket ayrıca, yaklaşan Apple Intelligence için olanlar da dahil olmak üzere modellerini, yayıncılardan lisanslı veriler, stok görseller ve web’den bazı herkese açık veriler içeren yüksek kaliteli veriler kullanarak eğittiğini doğruladı. YouTube’un transkripsiyon verilerinin herkese açık bir kaynak olması amaçlanmamıştır ancak tamamen görünümden gizlenip gizlenmediği açık değildir.
Sadece araştırma amaçlı
Apple ayrıca araştırma modelleri de oluşturur ve OpenELM de temelde budur, dil modelleri hakkında daha fazla bilgi edinmek için bir araçtır. OpenELM hakkında makale (PDF)Araştırmacılar, bunu Pile verileri üzerinde eğittiklerini belirtiyorlar.
Apple, OpenELM’in yalnızca araştırma amaçlı olduğunu ve diğer şeylerin yanı sıra en iyi iPhone’lar, en iyi iPad’ler ve en iyi Mac’ler de dahil olmak üzere herhangi bir Apple cihazındaki AI özelliklerini güçlendirmek için kullanılmadığını söylüyor. Dahası, OpenELM’in güneşteki anının neredeyse sona erdiği anlaşılıyor. Apple bize modelin gelecekteki sürümlerini inşa etmeyi planlamadığını söyledi.
Bütün bunlar, verileri Pile için toplanan ve Apple’ın OpenELM gibi diğer modellerde kullanılan YouTube içerik üreticilerine (TechRadar dahil) bir nebze olsun teselli verebilir; ancak EleutherAI’nin görünüşe göre bu verileri YouTube’dan veya içerik üreticilerinden izin almadan topladığı ve daha sonra Apple gibi şirketlere verdiği gerçeğini ele almıyor.
YouTube’un bundan sonra ne yapacağı henüz belli değil. Ancak şimdilik Apple, OpenELM ile bir kez daha işinin bittiğini ve verilerin asla Apple Intelligence’ın bir parçası olmayacağını açıkça belirtti.