Meta’nın geciken yapay zeka çabaları yeniden haber olmaya başladı. Microsoft CEO’su Satya Nadella geçtiğimiz günlerde OpenAI’nin AI yarışında tartışmasız çalışmak ve ChatGPT oluşturmak için 2 yıllık bir pisti olduğunu itiraf etti. Anthropic ve Google gibi diğer önde gelen yapay zeka laboratuvarları bu boşluğu hızla doldururken, Meta görünüşe göre ofiste buna ayak uydurmaya çalışarak uzun bir gün geçiriyor.
Büyük bir telif hakkı davası savaşı sırasında Meta Inc. içindeki dahili iletişimlere göre, şirketin yapay zeka modellerini eğitmek için telif hakkıyla korunan içeriği kullandığı ve görünüşe göre telif hakkı ihlaliyle ilgili sorunlardan kaçınmak için izlerini kapatmaya çalıştığı iddia ediliyor (üzerinden) eşik).
İlginç bir şekilde şirketin aldatıcı taktikleri, OpenAI’nin yapay zeka alanındaki hızlı ilerlemesine yetişme sürecini hızlandırmayı amaçlıyordu. Şirketin Yapay Zeka Genel Başkan Yardımcısı tarafından Meta Yapay Zeka araştırmacısı Hugo Touvron’a gönderilen bir e-posta, şirketin “Sınırları nasıl inşa edeceğini ve bu yarışı nasıl kazanacağını” öğrenmeyi içerecek “GPT4 olması gerektiğini” ortaya çıkardı.
Ancak, Facebook üreticisinin bu hedeflere ulaşma planlarıyla ilgili karmaşık ayrıntıların, modellerini eğitmek için kullanılacak kitap korsanlığı sitesi Library Genesis’i (LibGen) içerdiği bildirildi.
Verge’nin lanetli raporu ayrıca Meta’nın Ürün Direktörü Sony Theakanath’ın AI Araştırma Başkan Yardımcısı Joelle Pineau’ya gönderdiği ve LibGen’in verilerinin bir blog gönderisinde yer alan kıyaslamalar için dahili olarak mı kullanılacağına veya sitenin verilerinin bir blog gönderisine eğitim vermek için mi kullanılacağına dair netlik isteyen başka bir e-postayı da ortaya çıkardı. modeli. E-postada Theakanath, Gen AI’nin Llama3 için LibGen’i kullanmasının onaylandığını, ancak modelin sitedeki veriler kullanılarak eğitildiğini belirtmeden korsan veya çalıntı olarak etiketlenen verilerin hurdaya çıkarılması da dahil olmak üzere çeşitli hafifletmelerle birlikte belirtti.
Theakanath’a göre, “SOTA ile tanışmak için Libgen şart” [state-of-the-art] sayılar.” Ayrıca konuyu MZ yönetimindeki kuruluş içindeki bir yöneticiye, muhtemelen Meta CEO’su Mark Zuckerberg’e ilettikten sonra “OpenAI ve Mistral’ın kendi modelleri için kütüphaneyi (ağızdan ağıza) kullandıklarının bilindiğini” belirtti.
E-posta ayrıca, medyada yer alan düzenleyici müdahale ve müdahale tedbirleri de dahil olmak üzere telif hakkıyla korunan içerik kullanılarak yapay zeka modellerinin eğitiminin neden olduğu potansiyel politika risklerini de vurguladı ve Meta’nın telif hakkı ihlali uygulamalarını vurguladı. Theakanath, “Bu, düzenleyicilerle bu konulardaki müzakere pozisyonumuzu zayıflatabilir” diye ekledi.
Meta’nın döndüğü bildirildi izlerini kapatmak için kurnazca önlemler LibGen’in verilerini, telif hakkı başlıklarını ve telif hakkı sembolü gibi belge tanımlayıcılarını kaldırmak da dahil olmak üzere yapay zeka modellerini eğitmek için kullandıktan sonra. Belgede ayrıca çalışanların, “olası yasal komplikasyonları önlemek için” meta verileri hurdaya çıkarmak da dahil olmak üzere, çizgileri daha da bulanıklaştırmaya yönelik yorumları da yer aldı.
Telif hakkı ihlali yapay zeka modeli eğitimi için görünüşte çok önemli

Microsoft ve OpenAI sayısız telif hakkı ihlali davasıyla karşı karşıya kaldı. Bu davalardan bazıları hala mahkemede olsa da OpenAI CEO’su Sam Altman, yapay zeka modellerini telif hakkıyla korunan içerik olmadan eğitmenin neredeyse imkansız olduğunu itiraf etti. Ayrıca internetteki hemen hemen her şeyin telif hakkıyla korunduğunu belirterek, telif hakkıyla korunan içeriğin AI modellerini eğitmek için kullanılmasını adil kullanım olarak kabul etti. Telif hakkı yasasının, telif hakkıyla korunan içerik kullanılarak yapay zeka modellerinin eğitilmesini kategorik olarak yasaklamadığını savundu.
Yakın zamanda yayınlanan raporlar, OpenAI ve Anthropic dahil olmak üzere önde gelen yapay zeka laboratuvarlarının, yüksek kaliteli içerik eksikliği nedeniyle gelişmiş yapay zeka sistemleri geliştirmekte zorlandığını gösterdi. Ancak aralarında Sam Altman ve eski Google CEO’sunun da bulunduğu yapay zeka alanındaki liderler, ölçeklendirme yasalarının başladığını gösteren hiçbir kanıt bulunmadığını öne sürerek iddialara karşı çıktılar; “Duvar yok.”

