Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Jetonlar, günümüzün üretken yapay zekasının yetersiz kalmasının en büyük nedenlerinden biridir
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Jetonlar, günümüzün üretken yapay zekasının yetersiz kalmasının en büyük nedenlerinden biridir

Liste

Jetonlar, günümüzün üretken yapay zekasının yetersiz kalmasının en büyük nedenlerinden biridir

teknomers
Son güncelleme: 6 Temmuz 2024 20:28
teknomers
Paylaş
Paylaş


Üretken AI modelleri metni insanların yaptığı şekilde işlemez. “Jeton” tabanlı iç ortamlarını anlamak, bazı garip davranışlarını ve inatçı sınırlamalarını açıklamaya yardımcı olabilir.

Gemma gibi küçük cihaz üstü modellerden OpenAI’nin endüstri lideri GPT-4o’suna kadar çoğu model, dönüştürücü olarak bilinen bir mimari üzerine inşa edilmiştir. Dönüştürücülerin metin ve diğer veri türleri arasında ilişki kurma biçimi nedeniyle, ham metni alamaz veya çıktısını alamaz — en azından büyük miktarda hesaplama olmadan.

Dolayısıyla, hem pragmatik hem de teknik nedenlerden ötürü, günümüzün dönüştürücü modelleri, token adı verilen daha küçük, lokma büyüklüğündeki parçalara bölünmüş metinlerle çalışır; bu işleme tokenleştirme denir.

Jetonlar, “fantastik” gibi kelimeler olabilir. Ya da “fan”, “tas” ve “tic” gibi heceler olabilir. Jetonlaştırıcıya (jetonlaştırmayı yapan model) bağlı olarak, kelimelerdeki tek tek karakterler bile olabilirler (örneğin, “f”, “a”, “n”, “t”, “a”, “s”, “t”, “i”, “c”).

Bu yöntemi kullanarak, dönüştürücüler bağlam penceresi olarak bilinen bir üst sınıra ulaşmadan önce daha fazla bilgi (anlamsal anlamda) alabilirler. Ancak belirteçleştirme önyargılar da getirebilir.

Bazı token’ların garip aralıkları vardır, bu da raydan çıkarmak bir dönüştürücü. Bir belirteçleyici, örneğin “bir zamanlar” ifadesini “bir zamanlar”, “üzerine”, “bir”, “zaman” olarak kodlayabilirken, “bir zamanlar” ifadesini (sonunda boşluk olan) “bir zamanlar”, “üzerine”, “bir”, “” olarak kodlayabilir. Bir modelin nasıl uyarıldığına bağlı olarak — “bir zamanlar” veya “bir zamanlar” ile — sonuçlar tamamen farklı olabilir, çünkü model (bir kişinin anlayacağı gibi) anlamın aynı olduğunu anlamaz.

Tokenleştiriciler de durumu farklı ele alır. “Merhaba” bir model için “HELLO” ile aynı olmayabilir; “hello” genellikle bir tokendir (tokenleştiriciye bağlı olarak) ve “HELLO” üçe kadar olabilir (“HE”, “El” ve “O”). Bu yüzden birçok transformatör başarısız olur büyük harf testi.

“Bir dil modeli için tam olarak bir ‘kelime’nin ne olması gerektiği sorusunun etrafından dolanmak biraz zor ve insan uzmanları mükemmel bir belirteç sözlüğü konusunda anlaşsalar bile, modeller muhtemelen şeyleri daha da fazla ‘parçalamak’ için bunu faydalı bulacaktır,” dedi Northeastern Üniversitesi’nde büyük dil modeli yorumlanabilirliği üzerine çalışan bir doktora öğrencisi olan Sheridan Feucht TechCrunch’a. “Tahminimce bu tür bir belirsizlik nedeniyle mükemmel bir belirteç ayırıcı diye bir şey yoktur.”

Bu “bulanıklık” İngilizce dışındaki dillerde daha da fazla sorun yaratıyor.

Birçok belirteçleme yöntemi, bir cümledeki boşluğun yeni bir kelimeyi ifade ettiğini varsayar. Bunun nedeni, İngilizce düşünülerek tasarlanmış olmalarıdır. Ancak tüm diller kelimeleri ayırmak için boşluk kullanmaz. Çince ve Japonca bunu yapmaz — Korece, Tayca veya Khmerce de yapmaz.

2023 Oxford çalışmak İngilizce olmayan dillerin belirteçleştirilme biçimindeki farklılıklar nedeniyle, bir dönüştürücünün İngilizce olmayan bir dilde ifade edilen bir görevi tamamlamasının, aynı görevi İngilizce olarak ifade etmeye kıyasla iki kat daha uzun sürebileceğini buldu. Aynı çalışma — ve bir diğer — daha az “jeton verimliliğine sahip” dilleri kullananların, birçok yapay zeka satıcısının jeton başına ücret aldığı göz önüne alındığında, daha kötü model performansı görme olasılıklarının yüksek olduğu ancak kullanım için daha fazla ödeme yaptıkları bulundu.

Tokenleştiriciler genellikle logografik yazı sistemlerindeki her bir karakteri — basılı sembollerin telaffuzla ilişkisi olmayan kelimeleri temsil ettiği sistemler, örneğin Çince — ayrı bir token olarak ele alır ve bu da yüksek token sayılarına yol açar. Benzer şekilde, aglutinatif dilleri işleyen tokenleştiriciler — kelimelerin morfem adı verilen küçük anlamlı kelime öğelerinden oluştuğu diller, örneğin Türkçe — her bir morfemini bir tokene dönüştürme eğilimindedir ve bu da genel token sayılarını artırır. (Taycada “merhaba” için eşdeğer kelime olan สวัสดี, altı tokendir.)

2023 yılında Google DeepMind AI araştırmacısı Yennie Jun yürütülen farklı dillerin tokenizasyonunu ve bunun aşağı yönlü etkilerini karşılaştıran bir analiz. Jun, 52 dile çevrilmiş paralel metinlerden oluşan bir veri kümesi kullanarak, bazı dillerin İngilizcede aynı anlamı yakalamak için 10 kata kadar daha fazla tokene ihtiyaç duyduğunu gösterdi.

Dil eşitsizliklerinin ötesinde, tokenleştirme bugünün modellerinin neden kötü olduğunu açıklayabilir. matematik.

Rakamlar nadiren tutarlı bir şekilde belirteçleştirilir. Sayıların ne olduğunu gerçekten bilmediklerinden, belirteçleştiriciler “380”i tek bir belirteç olarak ele alabilir, ancak “381”i bir çift (“38” ve “1”) olarak gösterebilir — etkili bir şekilde ilişkileri mahvediyor denklemlerde ve formüllerde rakamlar ve sonuçlar arasında. Sonuç transformatör karışıklığıdır; yakın zamanda kağıt modellerin tekrarlayan sayısal kalıpları ve bağlamı, özellikle de zamansal verileri anlamakta zorluk çektiğini gösterdi. (Bkz: GPT-4 düşünüyor 7.735, 7.926’dan büyüktür).

Modellerin bu kadar popüler olmasının sebebi de bu anagram problemlerini çözmede pek iyi değiller veya kelimeleri ters çevirmek.

LLM’lerin birçok tuhaf davranışının ve sorunlarının aslında tokenleştirmeye dayandığını göreceğiz. Bu sorunların birçoğunu ele alacağız, tokenleştirmenin neden hatalı olduğunu ve neden birisinin bu aşamayı tamamen silmenin bir yolunu bulduğunu tartışacağız. resim.twitter.com/5haV7FvbBx

— Andrej Karpathy (@karpathy) 20 Şubat 2024

Yani, tokenleştirme açıkça üretken AI için zorluklar sunuyor. Bunlar çözülebilir mi?

Belki.

Feucht, “bayt düzeyindeki” durum alanı modellerine işaret ediyor MambaBayttokenizasyonu tamamen ortadan kaldırarak performans kaybı olmadan dönüştürücülerden çok daha fazla veriyi sindirebilir. Metni ve diğer verileri temsil eden ham baytlarla doğrudan çalışan MambaByte, yer değiştirmiş karakterler, boşluklar ve büyük harflerle yazılmış karakterler gibi “gürültüyü” daha iyi işlerken dil analiz görevlerinde bazı dönüştürücü modellerle rekabet edebilir.

Ancak MambaByte gibi modeller henüz erken araştırma aşamasında.

“Modellerin tokenizasyon dayatmadan karakterlere doğrudan bakmasına izin vermek muhtemelen en iyisidir, ancak şu anda bu dönüştürücüler için hesaplama açısından uygulanabilir değil,” dedi Feucht. “Özellikle dönüştürücü modeller için hesaplama, dizi uzunluğuyla ikinci dereceden ölçeklenir ve bu nedenle gerçekten kısa metin gösterimleri kullanmak istiyoruz.”

Tokenizasyonda bir atılım olmazsa, yeni model mimarilerinin anahtar olacağı anlaşılıyor.





genel-24

Fitness tutkunları için akıllı saat: Forerunner 245, Kara Cuma’da en yüksek fiyata
Samsung Galaxy Z Fold 7 ve Galaxy Z Flip 7 Daha Büyük Ekranlarla Tanıtılacak: Rapor
Galaxy S25 Edge gecikmez, çünkü bir sihirbaz asla geç kalmaz, ne de erken
Netflix’in One Piece Anlatıcı’sı, Canlı Aksiyon Programına İmza Atmasının İç Isıtıcı Nedenini Açıkladı
Microsoft, Activision Blizzard sendikalarını tanıma sözü verdi
ETİKETLENDİ:biridirbüyükgünümüzünjetonlarkalmasınınnedenlerindentokenleştirmeüretkenÜretken AIYapayyapay zekayetersizzekasının
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Netflix’te Temmuz 2024’te izlemeniz gereken 5 küçümsenen film
Sonraki Makale AMD’nin bir zamanlar Nvidia’yı satın almak istediği ancak anlaşmanın Jensen Haung’un talepleri nedeniyle gerçekleşmediği ortaya çıktı.

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Yeni Kahraman Cyberpunk Temalı Bir Şeytan Olacak
Oyun
Acil: Claude Fable 5 Sınırlı Süreyle Kullanıma Sunuldu!
Siber Güvenlik
2026 Yılında Geçerli Kriptopara Kurtarma Şirketi: Viste_ZEUS KRİPTO KURTARMA HİZMETLERİ
Yazılım
Justin Ernest’in geleneksel VC olmadan 500M$ yatırımı nasıl yaptı?
Yapay Zeka
Google AI Abonelik Fiyat Savaşlarında Uyarı Verdi
Genel
Destiny 2 Oyuncu Sayısında Rekor Artış, Son Güncelleme Heyecanı
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?