Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Yeni bir AI programlama yarışı sonuçlarını yayınladı ve durum pek iç açıcı değil.
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Yeni bir AI programlama yarışı sonuçlarını yayınladı ve durum pek iç açıcı değil.

Genel

Yeni bir AI programlama yarışı sonuçlarını yayınladı ve durum pek iç açıcı değil.

teknomers
Son güncelleme: 24 Temmuz 2025 03:04
teknomers
Paylaş
Paylaş

Yapay Zeka ile Kodlama Yarışması: K Prize’ın İlk Kazananı

Yapay zeka (YZ) teknolojileri, günümüzde yazılım mühendisliği alanında hızlı bir şekilde yükselişe geçiyor. Bunun bir göstergesi de Laude Enstitüsü tarafından düzenlenen K Prize yarışmasıdır. Bu yarışmanın en önemli karakteristiklerinden biri, katılımcılara sunulan zorlukluktur. K Prize, Databricks ve Perplexity kurucusu Andy Konwinski tarafından başlatılan çok aşamalı bir YZ kodlama yarışmasıdır.

Contents
  • Yapay Zeka ile Kodlama Yarışması: K Prize’ın İlk Kazananı
  • K Prize’ın Amaçları ve Zorlukları
  • Test Sonuçları ve Benchmark Sorunları
  • Yapay Zeka ve Yazılım Mühendisliği
  • Sonuç Olarak YZ ve Geleceği

Yarışmanın ilk kazananı ise Brezilyalı prompt mühendis Eduardo Rocha de Andrade oldu. Andrade, yarışmada şanslı bir şekilde 50.000 dolar ödül kazandı. Ancak daha da şaşırtıcı olan, Andrade’nin testte doğru yanıt sayısının sadece %7,5 olmasıdır.

K Prize’ın Amaçları ve Zorlukları

Konwinski, bu tür yarışmaların gerçekten anlamlı olması için zorlu olması gerektiğine inanıyor. “Önemli ve geçerli bir kriter oluşturduğumuz için mutluyuz,” diyor. YZ tabanlı sistemlerin, insan benzeri bir performans sergileyebilmesi için güçlü bir benchmark’a ihtiyacı var. Bu bağlamda, Konwinski, testte %90 üzeri bir puan alan ilk açık kaynak modeline 1 milyon dolar ödül vereceğini de duyurdu.

K Prize, daha önce tanınan SWE-Bench sistemine benzer bir yapıda, ancak çok farklı bir yaklaşımla çalışıyor. SWE-Bench, belirli bir problem setine dayansa da, K Prize, “kontaminasyon içermeyen bir versiyon” olarak tasarlandı. Bu, katılımcıların yalnızca belirli bir zaman diliminde sunulan sorunlarla yüzleşmesini sağlıyor ve belirli benchmark’lara özel antrenman yapılmasını engelliyor. İlk aşama için modeller, 12 Mart tarihine kadar teslim edilmeliydi. Yarışma organizatörleri, bu tarihten sonra GitHub üzerinde işaretlenmiş sorunlardan testler oluşturdu.

Test Sonuçları ve Benchmark Sorunları

Test sonucunda elde edilen %7,5’lik en yüksek puan, SWE-Bench’in daha kolay ‘Doğrulanmış’ testinde %75, daha zor ‘Tam’ testinde ise %34 şeklindeki sonuçlarla ciddi bir tezat oluşturuyor. Konwinski, bu farkın SWE-Bench üzerindeki kontaminasyonla mı yoksa GitHub üzerindeki yeni sorunları toplamanın zorluğuyla mı ilgili olduğunu henüz belirleyemediklerini ifade ediyor. Fakat, önümüzdeki süreçte daha fazla denemeyle bu sorulara cevap bulmayı ümit ettiklerini belirtiyor.

Yapay Zeka ve Yazılım Mühendisliği

Günümüzde birçok YZ kodlama aracının mevcut olmasına rağmen, bu tür zorlukların neden var olduğu merak edilebilir. SWE-Bench gibi standartların giderek kolaylaşması, birçok eleştirmenin K Prize gibi projeleri, YZ’nin değerlendirme sorununu çözme noktasında gerekli bir adım olarak görmesine neden oluyor. Princeton araştırmacısı Sayash Kapoor, mevcut benchmark’lar için yeni testler oluşturulmasının önemini vurguluyor. “Bu tür deneyler olmadan, sorunun kaynağını anlayamayız,” diyor.

Konwinski, sadece daha iyi bir benchmark oluşturmakla kalmayıp, sektöre daha geniş bir meydan okuma sunduğunu da belirtiyor. “Eğer tüm bu heyecana dikkat ederseniz, AI doktorlar, avukatlar ve yazılım mühendisleri görmemiz gerektiği söyleniyor; ama bu doğru değil,” açıklamasını yapıyor. %10’dan fazla bir sonuç elde edememek, onun için gerçekleri yansıtan bir durum.

Sonuç Olarak YZ ve Geleceği

K Prize, YZ tabanlı sistemlerin gerçek dünya koşullarında çözümleri nasıl başardığını gözler önüne seriyor. Bu tür zorlukların artması ve benzeri yarışmaların gerçekleştirilmesi, daha sağlam ve güvenilir YZ sistemlerinin geliştirilmesine katkı sağlayabilir. Bu nedenle, hem araştırma alanında hem de endüstride YZ sistemlerinin kalitesinin artırılmasına yönelik çalışmaların önümüzdeki yıllarda daha da önem kazanacağı aşikardır. Şimdiye kadar elde edilen sonuçlar, YZ’nin potansiyelini anlamada ve geliştirmede atılacak adımların ne kadar kritik olduğunu kanıtlıyor.

Güncel Teknoloji Haberleri – 1

AMD’nin Yeni Radeon RX 9060 XT Kartı Mayıs’ta Tanıtılabilir
Yapay zeka siber güvenlikte nasıl devrim yaratıyor?
Intel, bu yeni bir amiral gemisi mi? Core i9-14900K, tek iş parçacıklı modda daha düşük olmasına rağmen PassMark’ta Core Ultra 9 285K’dan %28,6 daha hızlıdır
FIFA 23 Pro Clubs Fragmanı Yeni Beceri Oyunlarını, Özelleştirme Seçeneklerini ve Daha Fazlasını Açıklıyor
Fortnite Whiplash konumları | PCOyunlarıN
ETİKETLENDİ:açıcıAndy KonwinskiBirDeğilDurumiçK PrizeLaude InstitutepekProgramlamaSonuçlarınıYarısıYayınladıYeni
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Samsung Galaxy Z Fold 7 ve Pixel 9 Pro Fold: Örnek Fotoğraflar Karşılaştırması
Sonraki Makale Rematch’in ilk büyük güncellemesi yayınlandı, ancak çapraz oyun yok.

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Lauf eElja Elektrikli Dağ Bisikleti İncelemesi: Gücü Hisset!
Genel
İIntel iGPU’suz mobil işlemcileri Core 200H serisine ekledi
Donanım
Yaz Oyun Festivali 2026’da Göz Kamaştıran Trailera Şahit Olun
Oyun
Apple’ın WWDC 2026 Anahtarı: İzleme Yöntemleri ve Beklentiler
Genel
Tanrıların İntikamı: God of War Laufey’de Sürpriz Karakterler Bekleniyor
Oyun
JMGO N3 Ultimate projektör, yeni taşınabilir 4K şampiyonu mu?
Liste
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?