Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Bir lise öğrencisi, AI modellerini bir minecraft yapımına meydan okumanıza izin veren bir web sitesi kurdu
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Bir lise öğrencisi, AI modellerini bir minecraft yapımına meydan okumanıza izin veren bir web sitesi kurdu

Liste

Bir lise öğrencisi, AI modellerini bir minecraft yapımına meydan okumanıza izin veren bir web sitesi kurdu

teknomers
Son güncelleme: 21 Mart 2025 00:03
teknomers
Paylaş
Paylaş

Geleneksel AI kıyaslama teknikleri yetersiz olduğu için, AI inşaatçıları üretken AI modellerinin yeteneklerini değerlendirmek için daha yaratıcı yollara yöneliyorlar. Bir grup geliştirici için, Microsoft’un sahip olduğu sanal alan yapım oyunu Minecraft.

Web sitesi Minecraft Benchmark (veya MC-Bench), Minecraft Creations ile yapılan istemlere yanıt vermek için baştan başa zorluklarda AI modellerini birbirine karşı çukurlaştırmak için işbirliği içinde geliştirilmiştir. Kullanıcılar hangi modelin daha iyi bir iş çıkardığına oy verebilirler ve ancak oy kullandıktan sonra hangi AI’nın her Minecraft derlemesini yaptığını görebilirler.

Resim Kredileri:Minecraft Benchmark (yeni bir pencerede açılır)

MC-Bench’i başlatan 12. sınıf öğrencisi Adi Singh için, Minecraft’ın değeri oyunun kendisi değil, ama insanların onunla sahip olduğu aşinalık-sonuçta, bu en çok satan Tüm zamanların video oyunu. Oyunu oynamayan insanlar için bile, bir ananasın hangi bloklu temsilinin daha iyi gerçekleştiğini değerlendirmek hala mümkündür.

“Minecraft, insanların ilerlemeyi görmesine izin verir [of AI development] Çok daha kolay, ”dedi Singh, TechCrunch’a.“ İnsanlar Minecraft’a, görünüme ve havaya alışkınlar. ”

MC-Bench şu anda sekiz kişiyi gönüllü katılımcı olarak listeliyor. Antropic, Google, Openai ve Alibaba, projenin ürünlerini MC-Bench’in web sitesine göre ölçüt istemleri çalıştırmak için kullanmasını sübvanse etti, ancak şirketler başka türlü bağlı değil.

“Şu anda GPT-3 döneminden ne kadar uzaklaştığımızı düşünmek için basit yapılar yapıyoruz, ancak [we] Kendimizi bu daha uzun biçimli planlara ve hedefe yönelik görevlere ölçeklendirirken görebiliyor, ”dedi Singh.“ Oyunlar sadece gerçek hayattan daha güvenli ve test amaçları için daha kontrol edilebilir, gözlerimde daha ideal hale getiren aracı akıl yürütmeyi test etmek için bir araç olabilir. ”

Pokémon Red gibi diğer oyunlar, Sokak avcı uçağıve Pictionary, kısmen kıyaslama yapay zeka sanatı çok zor olduğu için AI için deneysel ölçütler olarak kullanılmıştır.

Araştırmacılar genellikle AI modellerini test eder Standart değerlendirmelerancak bu testlerin çoğu AI’ye bir ev sahası avantajı sağlar. Eğitim şekli nedeniyle, modeller doğal olarak kesin, dar tür problem çözme, özellikle de ezberleme veya temel ekstrapolasyon gerektiren problem çözme türlerine yeteneklidir.

Basitçe söylemek gerekirse, Openai’nin GPT-4’ünün LSAT’daki 88. persentilde puan alabileceğini, ancak “Çilek” kelimesinde kaç Rs olduğunu fark edemeyeceği ne anlama geliyor. Antropik Claude 3.7 sonnet Standart bir yazılım mühendisliği ölçütünde% 62,3 doğruluk elde etti, ancak Pokémon oynamada beş yaşındaki çocuklardan daha kötü.

MC-Bench teknik olarak bir programlama ölçütüdür, çünkü modellerden “Kardan Adam Frosty” veya “bozulmamış bir kumlu kıyıda büyüleyici bir tropikal plaj kulübesi” gibi sorulan yapıyı oluşturmak için kod yazmaları istenir.

Ancak çoğu MC-Bench kullanıcısının, bir kardan adamın kodu kazmaktan daha iyi görünüp görünmediğini değerlendirmesi daha kolaydır, bu da projeye daha geniş bir çekiciliğe ve dolayısıyla hangi modellerin sürekli olarak daha iyi puan aldığı hakkında daha fazla veri toplama potansiyeli.

Bu puanların AI yararlılığının yolunda çok fazla olup olmadığı elbette tartışmaya hazırdır. Singh, güçlü bir sinyal olduklarını iddia ediyor.

Singh, “Mevcut liderlik, birçok saf metin ölçütünün aksine, bu modelleri kullanma konusundaki kendi deneyimimi oldukça yakından yansıtıyor” dedi. “Belki [MC-Bench] Şirketler için doğru yöne gittiklerini bilmeleri için yararlı olabilir. ”

Tm-En-2

Amazon Büyük Yaz İndirimi 2024: Premium Dizüstü Bilgisayarlarda En İyi Fırsatlar
Daha ucuz olamazdı: Galaxy Watch 7 şiddetli fiyat kaymasında
Exynos 1330 SoC, 50 Megapiksel Üçlü Arka Kameralı Samsung Galaxy M14 5G Piyasaya Sürüldü: Fiyat, Teknik Özellikler
iPhone 17’den sonra Apple’ı neler bekliyor?
Changan CS95 geçişi özellikle Rusya için geliştirilecek: “sıcak seçeneklere” sahip yeni bir Teknoloji paketi alacak
ETİKETLENDİ:BirİzinkurduLisemeydanMinecraftModelleriniÖğrencisiokumanızasitesiverenwebYapımına
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Yeni Survival Game Romestead, bir Twist ile Stardew Valley Town Builder gibidir
Sonraki Makale NVIDIA RTX 5060 en erken Nisan ayına kadar ertelenebilir

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Amazon Çalışanları Seattle’dan Yeni Veri Merkezlerine Ara Vermesini İstiyor
Liste
Herkese Açık Olarak Bir SaaS Motoru Geliştirmek: Stripe’a Bağlı Olmayan Bir Faturalama Motoru
Yazılım
Bruvi Pod Kahve Makinesi’nde Yüzde 50 İndirim! Şimdi Alın!
Genel
Vintage AMD GPU’ları Canlandıran AI Destekli R600 Sürücüsü
Donanım
Valor Mortis, Eylül Çıkış Tarihini Değiştirme Üzerine Düşünüyor
Oyun
Evotrex Dönüşüm Yaratarak Şarj İstasyonuna İhtiyaç Duymayan RV’ler İnşa Ediyor
Genel
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?