Openai, telif hakkıyla korunan O’Reilly Medya Kitapları konusunda AI modelleri eğitimli

Son güncelleme: 3 Nisan 2025 03:17

Openai, bir araştırma makalesine göre yapay zeka (AI) modellerini telif hakkıyla korunan içerik üzerinde eğitmiş olabilir. Kâr amacı gütmeyen kuruluş AI açıklamaları projesinden yakın zamanda yayınlanan bir makale olan San Francisco merkezli AI firmasının son büyük dil modelleri (LLMS), eski modellerine kıyasla telif hakkıyla korunan içeriğin daha yüksek bir şekilde tanınmasını gösterdi. Araştırmacılar, AI modellerinin eğitim veri kümesinde telif hakkıyla korunan içeriği tespit etmek için DE-COP adlı yakın zamanda geliştirilen bir yöntem kullandılar. Özellikle, çalışma GPT-4O mini’nin spesifik telif hakkıyla korunan içerik üzerinde eğitilmediğini bulmuştur.

Araştırmacılar, Openai’nin eğitim veri kümesini test etmek için DE-COP kullandı

. çalışmakLLM eğitim öncesi verilere kamu erişiminin ötesinde başlıklı olarak, Openai’nin AI modellerinin halka açık olmayan kitap içeriği konusunda eğitilip eğitilmediğini kontrol etmek için yapılmıştır. Çalışma için araştırmacılar, çok sayıda telif hakkıyla korunan kitap içeren bir ABD çevrimiçi öğrenme platformu olan O’Reilly Media’ya odaklandılar. Platformun kurucusu Tim O’Reilly de çalışmanın ortak yazarlarından biriydi.

Araştırmacılar, AI modellerinin eğitim verilerinin telif hakkıyla korunan materyal içerip içermediğini test etmek için DE-COP yöntemini kullandılar. Bu, bir kağıt Üyelik çıkarım saldırısı olarak da bilinen yöntem, bir AI modelini, makine tarafından oluşturulan açıklamalı alternatiflerden telif hakkıyla korunan içeriği tanımlayıp tanımlayamayacağını görmek için çoktan seçmeli bir testle bir AI modelini test eder.

Araştırmacılar, telif hakkıyla korunan materyali yorumlamak için Claude 3.5 sonnet kullandılar. Test için 34 O’Reilly medya kitabı 3,962 paragraf alıntı kullanıldı.

Yapılan testlere dayanarak, araştırmacılar, GPT-4O AI modelinin, alıcı çalışma karakteristik eğrisi (AURUC) skoru altında yüzde 82’lik bir alanla telif hakkıyla korunan ve ödeme wwalled O’Reilly kitap içeriğinin en yüksek tanınmasını gösterdiğini iddia ettiler. Özellikle, AURUC skoru DE-COP yönteminin bir parçasıdır ve çoktan seçmeli testten elde edilen tahmin oranlarından türetilmiştir.

Çalışma ayrıca, GPT-3.5 turbo gibi eski Openai AI modellerinin GPT-4O ile karşılaştırıldığında daha az içerik tanıma gösterdiğini, ancak yine de önemli olacak kadar yüksek olduğunu buldu. Bununla birlikte, GPT-4O MINI’nin ödeme duvarı O’Reilly medya kitapları üzerinde eğitilmediği bulunmuştur. Makale, bunun nedeninin testin daha küçük dil modellerine karşı etkili olmamasıdır.

genel-8

ETİKETLENDİ:AI ChatGPT eğitimli Hakkıyla kitapları konusunda korunan Medya Modelleri OpenAI Openai AI Model Eğitimi Telif hakkıyla korunan kitaplar Oreilly Research Paper Openai OReilly Telif veri gizliliği yapay zeka

Bu Makaleyi Paylaş

Önceki Makale

“Yüksek performanslı donanım” isteyen insanlara yönelik 2 Switch, Nintendo diyor

Sonraki Makale Nanowrimo organizasyonu kapanıyor

Openai, telif hakkıyla korunan O’Reilly Medya Kitapları konusunda AI modelleri eğitimli

Araştırmacılar, Openai’nin eğitim veri kümesini test etmek için DE-COP kullandı

Sanal Medya

Son Eklenenler

NZXT H6 Kasa ve Ultra RGB Fanlar: Sınırsız RGB Özelleştirme

GitLab, AI Yüklerine Hizmet Vermek İçin Personelinin %14’ünü Kesiyor

CoD Sezon 4 Güncellemesi: SG-12 Dengeleme ve Anti-Hile Yenilikleri

FirstClub 9 Ayda Değerini 255 Milyon Dolara Katladı

Nintendo Avrupa’da Değiştirilebilir Bataryaya Sahip Yeni Switch 2 Satacak

AMD yöneticileri Nvidia’nın RTX Spark’ına nasıl yanıt verdi?

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer