ChatGPT’ye atfetmeyi sevdiğimiz tüm zekaya rağmen, chatbot esasen evde eğitim gördü. Yaratıcısı OpenAI, onu halka açık internetin uçsuz bucaksız, kusurlu ihtişamı konusunda eğitti – ChatGPT’nin bu kadar çok utanç verici hata yapmasının bir nedeni. Kısa bir süre önce mahkeme tutanağını yazmak için chatbot’u kullanan bir avukat, var olmayan altı davaya atıfta bulunduğunda hata yaptığını fark etti. ChatGPT nasıl daha doğru olabilir? Daha kaliteli veriler üzerinde eğiterek üniversiteye gönderin.

Bu, dil modellerini eğitmek için kullanılabilecek değerli, doğru metinlere sahip olan yayıncılar ve diğer şirketler için yeni bir gelir akışının cazip olasılığını ortaya koyuyor. OpenAI için pahalı olacak, ancak Sam Altman’ın şirketinin, Google’ın, Meta Platformların ve sözde vakıf modelleri yapan diğer bir avuç büyük şirketin hakimiyetini pekiştirebilir. AI’nın yüksek öğrenimini karşılayabilecek birkaç kişi haline gelebilirler.

OpenAI, GPT-4 için eğitim verilerini bir sır olarak sakladı. Ancak önceki sürümler için, çoğu romantizm ve vampir kurgusuna eğilimli binlerce kendi kendine yayınlanan kitaptan oluşan çevrimiçi bir külliyat kullandı. Akademisyenler, Harry Potter serisi gibi internette yolunu bulan pek çok popüler kitabın muhtemelen GPT-4’te de yer aldığını keşfettiler; – AI şirketleri ödemeye istekliyse.

ChatGPT için iş, tıp, ekonomi ve daha pek çok alanda yoğun uzmanlıkları olan akademik kitap ve dergilerden daha iyi profesörler var mı?

Aylardır yapay zeka alanındaki tartışma, GPT-4’ün eğitim verilerinin büyük bir kısmının Reddit’ten gelmesiydi. Ardından geçen ay, popüler internet forumu, şirketlerden konuşma hazinesine erişmek için ücret almaya başlayacağını söyledi. UK Publishers Association’ın CEO’su Dan Conway’e göre bu, bazı kitap yayıncılarının geçmiş çalışmaları için aynısını yapıp yapamayacaklarını merak etmelerine neden oldu. “Bu çok canlı bir konuşma” diyor. “Olması gereken konuşmanın bir kısmı, içerik için lisanslamanın nasıl çalıştığıdır.”

OpenAI, ChatGPT’nin bir sonraki yinelemesini öğretmek için halka açık internetin ötesine bakmaya başlamak zorunda kalabileceğinden, bu sadece bir temenni değildir. Eğitildiği çevrimiçi veri kümeleri her zaman oldukça güvenilir veriler tutmuştur. Ancak ChatGPT artık herkesin bildiği bir sansasyon haline geldiğinden, bu veri kümeleri, bir sohbet robotunun sonuçlarını çarpıtmayı amaçlayan önemsiz verilerle spam edilmekle karşı karşıyadır – aynı şekilde SEO spam’ı Google sonuçlarını çarpıtır. OpenAI’nin daha uzağa bakması ve bir sonraki eğitim turu için ödeme yapmaya başlaması gerekebilir.

Şirket tek potansiyel alıcı değil. Kendi dil modellerini oluşturmak isteyen diğerleri de artık daha fazla veri istiyor. Nomad CEO’su Brad Schneider’e göre, özellikle müşterilerinin daha akıllı yatırım araştırması yapmasına yardımcı olmak isteyen yatırım bankaları, sofistike sohbet robotları kuruyor ve onları sigorta, navlun, telekomünikasyon ve perakende sektörlerindeki şirketlerden gelen veriler konusunda eğitiyor. veri için çevrimiçi pazar yeri.

OpenAI ve Google gibi büyük teknoloji firmaları dışında neredeyse hiç kimse temel dil modellerini sıfırdan inşa etmiyor, ancak birçok şirket GPT-4 gibi bu modellere erişim satın alıyor ve ardından bunları kendi amaçları için özel verilerle değiştiriyor. (Açıklama: Bloomberg, muhtemelen OpenAI’nin GPT-4’ü ile rekabet edecek olan kendi finans dil modelini duyurdu.)

Schneider, üç ay önce neredeyse hiç kimsenin dil modellerini bu şekilde eğitmek için veri satın almadığını söylüyor. Şimdi bu işlemler, platformundaki toplam hacmin yaklaşık yüzde 15’ini oluşturuyor ve fiyatları on binlerce ila milyonlarca dolar arasında değişiyor. Schneider, bir yapay zeka aracının yazılım programlama yapmasına yardımcı olabilecek veriler gibi yüksek talep gören benzersiz verilere sahip şirketlerin daha güçlü bir satış pozisyonunda olma eğiliminde olduğunu ekliyor.

Bir anlamda, tüm bunlar gelişen bir veri pazarına işaret ediyor. Bir veya iki yıl içinde, ChatGPT’ye özel alternatifler oluşturmak için veri alıp satan bir dizi sigorta firması, banka ve tıbbi şirket görebiliriz.

Ancak bu pazar, yerleşik teknoloji firmalarının hakim olduğu daha karanlık bir yöne de gidebilir. Bu, OpenAI ve Google’ın herkes için her şeyi yapabilen dil modelleri oluşturup oluşturmadığına bağlıdır – ChatGPT’nin bir dizi konuda uzmanlığa sahip bir tür İsviçre Çakısı versiyonu. Başka bir deyişle, genel amaçlı botlar niş botların yerini alabilir ve veri fiyatları çok yükselirse, bu niş botların oluşturulmasını da zorlaştırır.

Daha büyük teknoloji firmaları “bilgi işlem için her zaman daha fazla harcama yapabilecek” [and data] Hikâyeler üretmek için bir yapay zeka aracı olan Tome’un kurucu ortağı ve CEO’su Keith Peiris, “Bizim yapabileceğimizden çok daha fazla,” diyor. “İhtimaller, ille de yenilik nedeniyle değil, sermaye nedeniyle kazanacaklar.”

Bu yıllardır Big Tech’in hikayesiydi ve şimdi değişmesi pek mümkün değil.

© 2023 Bloomberg LP


Motorola Edge 40, geçtiğimiz yıl piyasaya sürülen Edge 30’un halefi olarak kısa süre önce ülkede görücüye çıktı. Nothing Phone 1 veya Realme Pro+ yerine bu telefonu satın almalı mısınız? Bunu ve daha fazlasını Gadgets 360 podcast’i Orbital’de tartışıyoruz. Orbital şu ​​adreste mevcuttur: spotify, Gaana, JioSaavn, Google Podcast’leri, Apple Podcast’leri, Amazon Müzik ve podcast’lerinizi nereden alırsanız alın.

(Bu hikaye NDTV personeli tarafından düzenlenmemiştir ve ortak yayından otomatik olarak oluşturulmuştur.)

Ortaklık bağlantıları otomatik olarak oluşturulabilir – ayrıntılar için etik beyanımıza bakın.



genel-8