Milyonlarca insan gibi, Mark Humphries’in de ChatGPT 2022’nin sonlarında piyasaya sürüldüğünde yaptığı ilk şey, ondan Bob Dylan tarzında şiir yazmak gibi salon numaraları yapmasını istemekti; bu çok etkileyici olmasına rağmen pek kullanışlı görünmüyordu. ona göre 18. yüzyıl kürk ticaretini inceleyen bir tarihçi. Ancak Kanada Waterloo’daki Wilfrid Laurier Üniversitesi’nde 43 yaşındaki profesör olan Humphries, uzun süredir yapay zekayı çalışmalarına uygulamakla ilgileniyordu. Eski yazıları ve yazı tiplerini kopyalamak için tasarlanmış özel bir metin tanıma aracını zaten kullanıyordu, ancak bu araç sık sık düzeltilmesi zaman alan hatalar yapıyordu. Merakla, aracın el yazısıyla yazılmış bir Fransızca mektubun bozuk yorumunu ChatGPT’ye yapıştırdı. Yapay zeka metni düzelterek, S olarak yanlış okunan tüm F’leri düzeltti ve hatta eksik aksanları ekledi. Daha sonra Humphries, ChatGPT’den bunu İngilizceye çevirmesini istedi. Bunu da yaptı. Belki de bu şeyin işe yarayacağını düşündü.

Humphries için yapay zeka araçları umut verici bir vaat taşıyordu. Son on yılda, arşivler ve kütüphanelerdeki milyonlarca belge tarandı ve dijitalleştirildi – Humphries’in kendisi de böyle bir çabaya dahildi – ancak bunların çok çeşitli formatları, yazı tipleri ve sözcük dağarcığı, bunları otomatik aramaya karşı aşılmaz hale getirdiğinden, onlarla çalışmak gerekliydi. muazzam miktarda manuel araştırma. Önceki bir proje için Humphries, çeşitli tıbbi kayıtlardan, savaş günlüklerinden, gazetelerden, personel dosyalarından ve diğer geçici belgelerden, şok geçiren birkaç yüz Birinci Dünya Savaşı askerinin biyografilerini bir araya getirdi. Her bir birey için materyali okumak, etiketlemek ve çapraz referans vermek yıllar sürdü ve araştırma görevlilerinden oluşan bir ekip vardı. Eğer yeni dil modelleri göründükleri kadar güçlü olsaydı, tüm bu materyali yüklemek ve modelden mermi şoku teşhisi konan her askerle ilgili tüm belgeleri çıkarmasını istemek mümkün olabilirdi.

Humphries, “Bu bir ömür boyu veya en azından on yıl sürecek bir iş” dedi. “Ve bunu büyüttüğünü hayal edebilirsiniz. X tarihinde bir askerin yaralanıp yaralanmadığını, X tarihinde o birimde neler olduğunu anlaması için bir yapay zekaya sahip olabilirsiniz ve ardından o birimin üyeleri hakkındaki bilgilere erişebilirsiniz; tarihçiler olarak bunu anlamaya asla zamanınız olmaz. Bireysel olarak takip edin” dedi. “Geçmişi anlamanın yeni yollarını açabilir.”

Geliştirilmiş veritabanı yönetimi, bazılarının öngördüğü dünyayı fetheden süper zekadan çok uzak olabilir, ancak bu, dil modellerinin gerçek dünyayı filtreleme biçiminin karakteristik özelliğidir. İtibaren kanun ile programlama Gazeteciliğe gelince, profesyoneller bu gelecek vaat eden, riskli ve çok tuhaf teknolojiyi işlerine entegre edip etmeyeceklerini ve nasıl entegre edeceklerini bulmaya çalışıyorlar. Tarihçiler için, tüm arşivleri sentezleyebilen ve aynı zamanda gerçekleri uydurma eğilimi olan bir teknoloji, korkutucu olduğu kadar çekici de ve bu alan, diğerleri gibi, böylesine potansiyel olarak güçlü ama kaygan bir teknolojinin sonuçlarıyla yeni yeni boğuşmaya başlıyor. alet.

San Antonio’daki Texas Üniversitesi’nde tarih profesörü olan Cindy Ermus’a göre, Amerikan Tarih Derneği’nin geçen ayki 137. yıllık toplantısında yapay zeka her yerde görünüyordu. Konuyla ilgili çeşitli panellerden birine başkanlık etti. Ermus, kendisinin ve birçok meslektaşının yapay zeka ile olan ilişkisini, işlerinin hangi yönlerinin ve nasıl değişeceğini hem heyecan hem de ihtiyatla merak eden “meraklı çocuklar” olarak tanımladı. “Koleksiyondan küratörlüğe, yazmaya ve tabii ki öğretmeye kadar tarihsel araştırmanın her aşamasını dönüştürecek” dedi. Lancaster Üniversitesi öğretim görevlisi Katherine McDonough’un, başlangıçta 19. yüzyıl Britanya’sının mühimmat araştırmaları üzerine eğitim almış, tarihi haritaları tarayabilen bir makine öğrenimi programı sunumundan özellikle etkilendi.

“Koleksiyondan küratörlüğe, yazmaya ve tabii ki öğretmeye kadar tarihsel araştırmanın her aşamasını dönüştürecek.”

Ermus, “‘Restoran’ kelimesini arattı ve yıllar içinde tonlarca tarihi haritada ‘restoran’ kelimesini buldu” dedi. “Tarihçi olmayan biri için bu çok büyük bir olay gibi gelmeyebilir, ancak bunu daha önce hiç yapamadık ve artık parmaklarımızın ucunda.”

Diğer bir katılımcı, Richmond Üniversitesi’nde liberal sanatlar ve dijital beşeri bilimler profesörü Lauren Tilton, on yılı aşkın bir süredir makine öğrenimi üzerinde çalışıyordu ve yakın zamanda Kongre Kütüphanesi ile birlikte çalışarak kurumun minimal etiketli fotoğraflardan oluşan geniş hazinesine bilgisayarlı görüntü uygulamak için çalıştı. ve filmler. Tüm arşivler önyargılıdır; başlangıçta hangi materyalin kaydedildiği ve nasıl organize edildiği konusunda. Yapay zekanın vaadinin, arşivleri geniş ölçekte açabilmesi ve geçmişteki arşivcilerin etiketlemeye yetecek kadar değer vermediği şeyleri aranabilir hale getirebilmesi olduğunu söyledi.

“Arşivde en çok anlatılan materyaller genellikle daha önce duyduğumuz türden seslerdir; ünlü politikacılar, ünlü yazarlar” dedi. “Fakat azınlıklaştırılmış topluluklardan, farklı etnik kökenlerden gelen topluluklardan, LGBTQ topluluklarından insanların anlatması zor olan pek çok hikayesi olduğunu biliyoruz, bunun nedeni insanların istememesi değil, arşivde arama yapmanın zorluklarıydı.”

Ancak yapay zeka sistemlerinin kendi önyargıları var. Eğitim verilerinin cinsiyetini, ırkını ve diğer önyargılarını yansıtma konusunda iyi belgelenmiş bir eğilime sahipler; Ermus’un işaret ettiği gibi, GPT-4’ten bir tarih profesörü imajı oluşturmasını istediğinde, yaşlı bir kişiyi çizmişti. Ceketinde dirsek yaması olan beyaz bir adam ama aynı zamanda Tilton’un “şimdiki zamancılık” olarak adlandırdığı bir önyargı da sergiliyorlar. Eğitim verilerinin büyük çoğunluğu çağdaş internetten alındığı için modeller çağdaş bir dünya görüşünü yansıtıyor. Tilton, görüntü tanıma sistemlerinin eski fotoğrafları anlamlandırmakta zorlandığını keşfettiğinde bu olguyla karşılaştı; örneğin daktiloları bilgisayar, kağıt ağırlıklarını ise fare olarak etiketledi. Bunlar görüntü tanıma sistemleriydi ancak dil modellerinde de benzer bir sorun var.

ChatGPT’den etkilenen Humphries, OpenAI API’sine kaydoldu ve bir yapay zeka araştırma asistanı yapmak için yola çıktı. 18. yüzyıl kürk tüccarlarının izini, içinde geçici olarak göründükleri mektuplar, günlükler, evlilik cüzdanları, yasal belgeler, kilise kayıtları ve sözleşmeler bataklığında bulmaya çalışıyordu. Amacı, süreci otomatikleştirebilecek bir sistem tasarlamaktı.

Karşılaştığı ilk zorluklardan biri, 18. yüzyıl kürk tüccarlarının dil modelinin varsaydığı gibi konuşmamasıydı.

Karşılaştığı ilk zorluklardan biri, 18. yüzyıl kürk tüccarlarının dil modelinin varsaydığı gibi konuşmamasıydı. GPT-4’ten benim yaptığım gibi örnek bir giriş yazmasını isteyin; bu, vahşi doğanın yüce yalnızlığı hakkında uzun düşünceler üretecek ve şöyle şeyler söyleyecektir: “Bu sabah, gökyüzü ısrarlı bir çiseleyen yağmurla açıldı ve ormanı bir yağmur bulutu gibi gizledi. sis ve melankoli perdesi” ve “Her zorluğa deneyimli bir ormancının metanetiyle göğüs geren Bruno, şimdi derme çatma çadırımızın barınağı altında hareketsiz yatıyordu; bu, bu evcilleştirilmemiş topraklardaki yaşamın kırılganlığının sessiz bir kanıtıydı.”

Oysa gerçek bir kürk tüccarı çok daha kısa ve öz konuşur. Örneğin, “Güzel Hava. Dün ölen genç bu sabah toprağa verildi ve mezarı Pickets’le çevrildi. 9 Adam, Gum’a getirdikleri Sakızı toplamaya gitti. 3 Kano, diğerleri dünkü gibi kullanıldı,” diye yazmıştı 1806’da, ağaç kabuğu kanolarının dikişlerini kapatmak için ağaç özsuyu toplamaktan bahsediyordu.

Humphries, “Sorun şu ki, dil modeli böyle bir kaydı algılayamıyor çünkü böyle bir olayı temsil etmek üzere eğitildiği yansıtıcı yazı türünü içermiyor” dedi. Çağdaş blog gönderileri ve makaleler üzerine eğitim almış biri, bir arkadaşının ölümünün ardından özsu malzemelerinin bir envanterinin değil, uzun duygusal hatıraların gelmesini beklerdi.

Yüzlerce kürk tüccarı örneği üzerinde modele ince ayar yaparak Humphries, sorulara yanıt olarak günlük girişlerini çıkarmayı başardı, ancak her zaman alakalı olanları değil. Eski sözcük dağarcığı hâlâ sorun teşkil ediyordu; değişkenlikbir kanonun kaburga kemiği için kullanılan ve modelin eğitim verilerinde nadiren görülen Fransızca bir terimdir.

Pek çok deneme yanılmanın ardından belgeleri sıralamak, anahtar sözcükleri ve anlamları aramak ve sorguların yanıtlarını sentezlemek için birden fazla model kullanan bir yapay zeka montaj hattını elde etti. Çok zaman aldı ve çok fazla müdahale gerektirdi ama GPT ona ihtiyaç duyduğu Python’u öğretmeye yardımcı oldu. Sisteme en zeki kedisinin onuruna HistoryPearl adını verdi.

Sistemini, kendisi hakkında üçüncü şahıs olarak yazan ve tuhaf bir mizah anlayışı kullanan Norveçli tüccar Ferdinand Wentzel gibi uç vakalara karşı test etti; örneğin, oğlunun doğumu hakkında babalığı hakkında spekülasyonlar yaparak ve kendi kendini aldatarak yazıyordu. kendi boyuyla ilgili küçümseyici şakalar – “FW’nin Kızı güvenli bir şekilde bir erkek çocuktan kurtuldu. – Neredeyse onun Oğlu olduğuna inanıyorum çünkü yüz hatları ona benziyor ve kısa bacakları da bu görüşü şüpheye yer bırakmayacak şekilde belirliyor gibi görünüyor. Bu tür yazılar önceki modelleri engelledi, ancak HistoryPearl, Wentzel’in mizahıyla ilgili belirsiz bir şekilde ifade edilmiş bir soruya yanıt olarak, Wentzel’in Humphries’in aramadığı diğer zeka örneklerinin yanı sıra bunu ortaya çıkarabilirdi.

Araç hâlâ bazı şeyleri gözden kaçırıyordu ancak Humphries’in normalde bu tür işler için işe aldığı ortalama yüksek lisans öğrencisinden daha iyi performans gösterdi. Ve daha hızlı. Ve çok çok daha ucuz. Geçen Kasım ayında OpenAI, API çağrılarının fiyatlarını düşürdükten sonra bazı kaba hesaplamalar yaptı. Bir yüksek lisans öğrencisine bütün bir yaz boyunca yapması için yaklaşık 16.000 dolar ödeyeceği şeyi, GPT-4 yaklaşık 70 dolara yaklaşık bir saatte yapabiliyordu.

“Yüksek eğitimciler olarak varoluş amacımız için son derece gerçek, varoluşsal bir tehdit oluşturduğunu tam olarak anlamadan, hâlâ teknolojiden sanki teorik bir şeymiş gibi bahsediyorlar.”

“İşte o an şunu fark ettim: ‘Tamam, bu her şeyi değiştirmeye başlıyor’” dedi. Bir araştırmacı olarak heyecan vericiydi. Bir öğretmen olarak bu çok korkutucuydu. Kürk ticareti kayıtlarını düzenlemek niş bir uygulama olabilir, ancak çok sayıda beyaz yakalı iş benzer bilgi yönetimi görevlerinden oluşur. Öğrencilerinin tam da bu tür işlerde başarılı olmalarını sağlayacak araştırma ve düşünme becerilerini öğrenmeleri gerekiyordu. Kasım ayında bir yayın yayınladı. haber bülteni akademideki meslektaşlarına yapay zekanın hızlı gelişimini ciddiye almaları için yalvarıyor. “Yapay zeka pek çok insanın hayal gücünü aşmaya başlıyor” diye yazdı. “Yüksek eğitimciler olarak varoluş amacımız için son derece gerçek, varoluşsal bir tehdit oluşturduğunu tam olarak anlamadan, hâlâ teknolojiden sanki teorik bir şeymiş gibi bahsediyorlar.”

Ancak bu arada, yaptığı tamirlerin “kavram kanıtı” olarak adlandırdığı şeyle sonuçlanmasından memnundu: potansiyel olarak yararlı olacak kadar güvenilir, ancak henüz tamamen güvenmek için yeterli değil. Humphries ve araştırma ortağı tarihçi Lianne Leddy, araştırmalarını veri tabanlarındaki 30.000 gezginin tamamını kapsayacak şekilde ölçeklendirmek için bir bağış sundu. Bir bakıma emekten tasarruf sağlayan bu sistemi geliştirmek için gereken emeği rahatlatıcı buldu. Modeldeki en büyük gelişme, modele doğru verinin sağlanmasıyla geldi; bu da onun yalnızca malzeme konusundaki uzmanlığı sayesinde başarabildiği bir şeydi. Son zamanlarda, beşeri bilimlerin öğrettiği türden araştırma ve eleştirel değerlendirme becerilerine sahip alan uzmanlarına daha fazla talep olabileceğini düşünüyor. Bu yıl Sanat Fakültesi’nde kendi tasarladığı uygulamalı bir üretken yapay zeka programını öğretecek.

“Bazı açılardan bu yeni şişelerdeki eski şarap, değil mi?” dedi. 20. yüzyılın ortalarında şirketlerin, yalnızca belgeleri saklama ve düzenleme konusunda değil, malzemenin kendisi konusunda da uzman araştırmacıların görev yaptığı geniş kurumsal arşivlere sahip olduğuna dikkat çekti. “Bu verilerin çoğunu faydalı hale getirmek için hem modellerin nasıl eğitileceğini anlama becerisine sahip, hem de daha önemlisi neyin iyi içerik olup neyin olmadığını anlayan insanlara ihtiyaç var. Bunun güven verici olduğunu düşünüyorum” dedi. “Kendimi kandırıp kandırmadığım başka bir soru.”



genel-2