Perşembe sabahı, birisinin Michigan Üniversitesi’ndeki öğrenci verilerini yapay zeka sohbet robotu teknolojisi geliştiren teknoloji çalışanlarına sattığı haberi geldi. Şirketin yapay zeka araştırma merkezi Google DeepMind’dan bir çalışan, derslerin, öğrenci tartışmalarının ve ofis saatlerinin kayıtlarının yanı sıra son sınıf öğrencileri ve yüksek lisans öğrencileri tarafından yazılan makalelerin çok düşük bir lisans ücreti karşılığında kaydedilmesi için bir teklif aldıklarını söyledi. Artık Üniversite, öğrencilerin rızasını verdiklerinin bir yanlış anlaşılma olduğunu ve endişelenecek bir şey olmadığını söylüyor.

DeepMind’da mühendis olan Susan Zhang, bilgileri pazarlayan ve değerini kanıtlamak için Michigan Üniversitesi verilerinin ücretsiz bir örneğini sunan sponsorlu bir LinkedIn mesajı aldığını söyledi.

Satış mesajında ​​”Profilinize göre Büyük Dil modelleri (LLM’ler) veya doğal dil işleme ile çalışıyor olabileceğiniz için size ulaşıyorum” deniyordu. “Michigan Üniversitesi’nin, eğitim veya LLM’lerin ayarlanması için çok faydalı olabilecek akademik konuşma verilerini ve öğrenci ödevlerini lisansladığını bilmenizi isterim.”

Mesaj, 85 saatlik derslerden, tartışma bölümlerinden ve röportajlardan verileri 15.595 dolara, Michigan Üniversitesi öğrencilerinin çeşitli disiplinlerde yazdığı 829 makaleden oluşan ikinci bir seti 12.595 dolara veya her iki veri seti için 25.000 dolara indirim paketi sunuyor.

Ancak Michigan Üniversitesi sözcüsü Colleen Mastony, bir e-postada, mesajın “yanlış bilgi paylaşan ve o zamandan beri çalışmalarını durdurması istenen yeni bir üçüncü taraf satıcı tarafından gönderildiğini” söyledi. “Satıcı tarafından herhangi bir işlem veya içerik paylaşımı gerçekleşmedi. Öğrenci verileri Michigan Üniversitesi tarafından satışa sunulmadı ve hiçbir zaman da satılmadı.” Mastony, bu satıcının kim olduğuna veya sundukları bilgilerin tam olarak neyin yanlış olduğuna ilişkin ayrıntıları paylaşmadı.

Üniversite verileri doğrudan satmıyor olabilir, ancak Michigan Üniversitesi ve Kuzey Carolina Eyalet Üniversitesi ile ortak olduğunu iddia eden Catalyst Research Alliance adlı bir kuruluş tarafından satışa sunuluyor (ya da teklif ediliyordu). web sitesi veri setinin bir örneğini sunuyor“Avrupa Birliği’nin Demokratik Yetersizlikleri” başlıklı bir makale ve bir sınıf tartışması bölümünün kaydı gibi görünen bir makale ile birlikte geliyor.

Catalyst Research Alliance ve North Carolina Eyalet Üniversitesi yorum taleplerine hemen yanıt vermedi.

Mastony’ye göre, kayıtlar ve makaleler, yirmi yıllık araştırma çalışmalarına katılan gönüllü öğrenciler tarafından katkıda bulunulmuştu ve hiçbir veri, öğrencilerin isimlerini veya kişisel olarak tanımlanabilir herhangi bir bilgiyi içermiyordu. Mastony, akademisyenlere ücretsiz olarak (yine herhangi bir tanımlayıcı bilgi olmadan) ve eğitimde yazı ve ifadeyi geliştirmek için bir araç olarak kullanıldığını söyledi.

Zhang, X’teki bir mesajında ​​Gizmodo’ya şunları söyledi: “Hangi üniversitelerin öğrenci verilerini sattığını ve şartların ne olduğunu takip etmeye değer olduğunu düşünüyorum.” İçerik oluşturucular bir kuruş bile görmeyecek, oysa verileri depolayan satıcı tüm kârı ele geçirecek.)

ChatGPT ve Bard gibi sohbet robotlarını çalıştıran yazılımlar gibi büyük dil modellerini eğitmek, çeşitli konular ve disiplinler genelinde devasa, açıkça etiketlenmiş veri kümeleri gerektirir. Michigan Üniversitesi veri seti küçük olsa da, dar bir konu yelpazesine ilişkin iyi organize edilmiş içerik, belirli modellerin ayarlanması, özellikle de akademi, resmi iletişim ile ilgili belirli amaçlar için tasarlanmış araçlar veya daha genel yapay zekaların kendi durumlarını iyileştirmek için eğitilmesi için yararlı olabilir. konu uzmanlığının bireysel alanlarındaki performans.

Güncelleme 15.02.2024, 17:45 ET: Bu hikaye Michigan Üniversitesi’nin yorumlarıyla güncellendi.



genel-7