Reddit’in borsada listelenmeye doğru ilerleyen beklentileri, OpenAI gibi yapay zeka tedarikçileriyle ilişkilerle beklenenden çok daha fazla ilgili.

Reddit, bugün ABD Menkul Kıymetler ve Borsa Komisyonu’na sunduğu halka arz izahnamesinde, 1 milyardan fazla gönderisi ve 16’dan fazla gönderisinde yapay zeka modellerini eğiten şirketlerle yapılan veri lisanslama anlaşmalarından ne kadar kazanacağını ve kazandığını düşündüğünü defalarca vurguladı. milyar yorum.

İzahnamede, “Ocak 2024’te, toplam sözleşme değeri 203,0 milyon dolar olan ve süreleri iki ila üç yıl arasında değişen belirli veri lisanslama düzenlemelerine girdik” deniyor. “31 Aralık 2024’te sona eren yıl ve sonrasında en az 66,4 milyon dolarlık gelirin muhasebeleştirilmesini bekliyoruz.”

Şu ana kadar hangi yapay zeka sağlayıcılarının Reddit’ten veri lisansı aldığı ise bir muamma. Bu haftanın başında Bloomberg ve Reuters rapor edildi “İsimsiz büyük bir yapay zeka şirketi” — muhtemelen Google – yıllık bazda yaklaşık 60 milyon dolar değerinde bir lisans anlaşması imzalamıştı. Ancak OpenAI de şaşırtıcı bir müşteri olmayacaktır, özellikle de OpenAI CEO’su Sam Altman’ın %8,7’lik bir pazar payına sahip olduğu göz önüne alındığında. hisse Reddit’te (onu üçüncü büyük hissedar yapıyor) ve bir zamanlar şirketin yönetim kurulu üyesiydi.

Reddit verileri neden değerli? Reddit’in açıkladığı gibi, yapay zeka modelleri örneklerden el sanatları makalelerine, kodlara, e-postalara, makalelere ve daha fazlasına kadar “öğreniyor” ve OpenAI gibi satıcılar eğitim setlerine eklemek için bu örneklerin milyonlarca ila milyarlarcasını web’den sıyırıyor. Bazı örnekler kamu malıdır. Diğerleri ise – Reddit içeriği söz konusu olduğunda – alıntı veya belirli tazminat biçimleri gerektiren kısıtlayıcı lisanslara tabi değildir.

Reddit daha önce AI eğitimi amacıyla verilerine erişimi engellemiyordu. Ancak geçen yıl, CEO Steve Huffman’ın sözleriyle, verilerinin böyle olmaması gerektiğini savunarak rotayı tersine çevirdi.[given] dünyanın en büyük şirketlerinden bazılarına ücretsiz olarak.”

“[Our] veri API’leri spor, filmler, haberler, moda ve en son trendler gibi gelişen ve dinamik konulara gerçek zamanlı erişim sağlayabiliyor,” diye devam ediyor izahname. “Reddit’in devasa konuşma veri ve bilgi birikiminin, büyük dil modellerinin eğitiminde ve geliştirilmesinde rol oynamaya devam edeceğine inanıyoruz. İçeriğimiz her geçen gün yenilenip büyüdükçe modellerin bu yeni fikirleri yansıtmak ve Reddit verilerini kullanarak eğitimlerini güncellemek isteyeceğini düşünüyoruz.”

Hazır medya kitaplıklarından haber yayıncılarına kadar içerik üreticileri, OpenAI’nin ChatGPT’si ve Google’ın Gemini’si gibi sohbet robotlarının trafiği sekteye uğratmakla tehdit etmesi nedeniyle yapay zeka satıcılarıyla veri lisanslama anlaşmalarına giderek daha fazla yöneliyor. The Atlantic’in yeni bir modeli kurmak Google gibi bir arama motoru yapay zekayı aramaya entegre ederse, web sitesine tıklamaya gerek kalmadan kullanıcının sorgusunu %75 oranında yanıtlayabilir.

Satıcılar da, modellerini izinsiz veya ödemesiz veriler üzerinde eğitmek için hiçbir yasal gerekçeye sahip olmadıklarını iddia eden çok sayıda davayla karşı karşıya kaldıklarından, lisans anlaşmaları yapmaya teşvik edildi. Son zamanlarda New York Times, OpenAI’yi, onun çalışmalarını kullanarak etkin bir şekilde haber yayıncısı rakipleri oluşturmakla ve işine zarar vermekle suçladı.

OpenAI’nin, resim galerisi Shutterstock’un yanı sıra Politico ve Business Insider’ın sahibi Axel Springer gibi yayıncılarla da anlaşmaları var. Lisanslar rapor edildi ancak oldukça küçük olacak – yılda 5 milyon dolara ulaşıyor.



genel-24