Eski Yunanca’da bilgin olmak temelde yeterince zor değilmiş gibi, güvendikleri birincil metinler, binlerce yıllık oldukları için sıklıkla onarılamayacak şekilde hasar görür. Tarihçiler, yeni ve güçlü bir araca sahip olabilir. ithaca, DeepMind tarafından geliştirilen ve eksik kelimeler, metnin yeri ve tarihi hakkında şaşırtıcı derecede doğru tahminler yapan bir makine öğrenimi modeli. Sıra dışı bir AI uygulamasıdır, ancak teknoloji dünyasının dışında ne kadar yararlı olabileceğini gösteren bir uygulamadır.

Eksik antik metinler sorunu, uzmanların kalitesiz malzemelerle çalıştığı birçok disiplini kapsar. Orijinal belge taş, kil veya papirüsten yapılmış olabilir ve Akadca, antik Yunanca veya Lineer A ile yazılmış olabilir ve bir bakkalın faturasından bir kahramanın yolculuğuna kadar her şeyi açıklayabilir. Hepsinin ortak noktası ise binlerce yılda birikmiş hasarlardır.

Metnin aşındığı veya yırtıldığı boşluklara genellikle boşluk denir ve eksik bir harf kadar kısa veya bir bölüm kadar uzun olabilir veya aslında tüm bir hikaye olabilir. Bunları doldurmak önemsiz veya imkansız olabilir, ancak bir yerden başlamalısınız – ve Ithaca’nın yardım etmesi gereken yer burasıdır.

Büyük bir antik Yunan metinleri kütüphanesinde eğitilen Ithaca (adını Odysseus’un ana adasından almıştır) sadece eksik bir kelimenin veya ifadenin ne olabileceğini söylemekle kalmaz, aynı zamanda kaç yaşında olduğunu ve nerede yazıldığını da görebilir. Bütün bir destansı döngüyü kendi başına doldurmayacak – bu metinlerle çalışanlar için bir çözüm değil, bir araç olması gerekiyordu.

Nature dergisinde yayınlanan bir makale, Periclean Atina’dan alınan bazı kararnameleri örnek olarak kullanarak etkinliğini göstermektedir. MÖ 445 civarında yazıldığı düşünülen Ithaca, metinsel analizine dayanarak, daha yeni kanıtlara uygun olarak, aslında MÖ 420 civarında olduklarını öne sürdü. Kulağa çok fazla gelmeyebilir, ancak Haklar Bildirgesi’nin gerçekten 20 yıl sonra yazıldığını hayal edin!

Resim Kredisi: Derin Düşünce

Metnin kendisine gelince, çalışmadaki uzmanlar onu ilk geçişte yüzde 25 oranında doğru anladılar, tam olarak mükemmel değil, elbette metin restorasyonunun bir öğleden sonra eğlencesi değil, uzun vadeli bir proje olması gerekiyordu. Ancak Ithaca ile eşleştirildiklerinde, hızla yüzde 72 doğruluk elde ettiler. Bu genellikle, insanların nihai olarak daha doğru olduğu, ancak çıkmaz noktaları hızla ortadan kaldırarak veya bir başlangıç ​​noktası önererek süreçlerini hızlandırabilecekleri diğer durumlarda durum olarak bulunur. Tıbbi verilerde, yapay zekanın hızlı bir şekilde işaretleyebileceği bir anormalliği denetlemek kolay olabilir – ancak nihayetinde ayrıntıları algılayan ve doğru cevabı bulan insan uzmanlığıdır.

bir test edebilirsiniz Ithaca’nın kısaltılmış versiyonu burada, Elinizde boşluklarla dolu eski Yunanca bir metin varsa veya istenen boşlukları nasıl doldurduğunu görmek için verilen örneklerden birini kullanın. Daha uzun parçalar veya 10’dan fazla harf eksikse, deneyin. bu Colab not defteri. kod şu adreste mevcuttur: bu GitHub sayfası.

Antik Yunanca, Ithaca’nın başlayacağı açık ve verimli bir alan olsa da, ekip diğer diller üzerinde de zaten çok çalışıyor. Akadca, Demotik, İbranice ve Maya listelerinin tümü listede ve umarım zamanla daha fazlası eklenecektir.

Atina Üniversitesi’nde proje üzerinde çalışan profesör Ion Androutsopoulos, “Ithaca, doğal dil işleme ve makine öğreniminin beşeri bilimlere potansiyel katkısını gösteriyor” dedi. “Bu potansiyeli daha fazla sergilemek için Ithaca gibi daha fazla projeye ihtiyacımız var, aynı zamanda hem beşeri bilimler hem de yapay zeka yöntemleri hakkında daha iyi ortak bir anlayışa sahip olacak gelecekteki araştırmacıları eğitmek için uygun kurslara ve öğretim materyallerine ihtiyacımız var.”



genel-24

Bir yanıt yazın