Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Bu hafta AI’da: Belki şimdilik AI kriterlerini görmezden gelmeliyiz
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Bu hafta AI’da: Belki şimdilik AI kriterlerini görmezden gelmeliyiz

Liste

Bu hafta AI’da: Belki şimdilik AI kriterlerini görmezden gelmeliyiz

teknomers
Son güncelleme: 20 Şubat 2025 11:53
teknomers
Paylaş
Paylaş


Contents
  • Haberler
  • Haftanın Araştırma Raporu
  • Haftanın Modeli
  • Çanta

TechCrunch’ın normal AI bültenine hoş geldiniz! Biraz hiatus gidiyoruz, ancak TechCrunch’ta sütunlarım, günlük analizlerimiz ve son dakika haberleri dahil tüm AI kapsamımızı bulabilirsiniz. Bu hikayeleri ve her gün gelen kutunuzda çok daha fazlasını istiyorsanız, günlük bültenlerimize kaydolun.

Bu hafta, milyarder Elon Musk’un AI girişimi Xai, şirketin GROK chatbot uygulamalarına güç veren en son amiral gemisi AI modeli GroK 3’ü yayınladı. Yaklaşık 200.000 GPU üzerinde eğitilen model, Openai de dahil olmak üzere diğer önde gelen modeli matematik, programlama ve daha fazlası için ölçerle yener.

Ama bu kriterler bize gerçekten ne anlatıyor?

Burada TC’de, yapay zeka endüstrisinin model iyileştirmelerini ölçen birkaç (nispeten) standartlaştırılmış yollardan biri oldukları için genellikle isteksizce karşılaştırma rakamları rapor ediyoruz. Popüler AI kriterleri ezoterik bilgi için test etme eğilimindedir ve çoğu insanın önem verdiği görevlerdeki yeterlilikle kötü ilişkili olan toplam puanlar verir.

Wharton Profesör Ethan Mollick’in işaret ettiği gibi x’de bir dizi gönderi Grook 3’ün Pazartesi günü açılmasından sonra, “daha ​​iyi test pilleri ve bağımsız test yetkilileri için acil bir ihtiyaç var”. AI şirketleri, Mollick’in ima edildiği gibi, bu sonuçları yüz değerinde kabul etmek için daha da zor hale getiren kendi kendine bildirim kıyaslama sonuçlarını daha sık değil.

Mollick, “Halka açık kriterler hem ‘meh’ hem de doymuş, tada dayalı gıda incelemeleri gibi olmak için birçok AI testi bırakıyor” diye yazdı. “Yapay zeka çalışmak için kritik ise, daha fazlasına ihtiyacımız var.”

Kıtlık yok bağımsız testler Ve kuruluşlar Yapay zeka için yeni kriterler önermek, ancak göreceli liyakat endüstri içindeki yerleşik bir konudan uzaktır. Bazı AI yorumcuları ve uzmanları öneriyor Kıyaslamaların ekonomik etki ile hizalanması yararlılıklarını sağlamak için Diğerleri benimsemenin ve faydanın nihai ölçütlerdir.

Bu tartışma zamanın sonuna kadar öfkelenebilir. Belki bunun yerine yapmalıyız, X User Roon’un reçete ettiği gibisadece büyük AI teknik atılımlarını engelleyen yeni modellere ve kriterlere daha az dikkat edin. Kolektif akıl sağlığımız için, bir miktar AI fomo’ya neden olsa bile, bu en kötü fikir olmayabilir.

Yukarıda belirtildiği gibi, bu hafta yapay zeka içinde hiatus gidiyor. Bir yolculuğun bu roller coaster aracılığıyla bizimle, okuyuculara bağlı kaldığınız için teşekkürler. Bir dahaki sefere kadar.

Haberler

Resim Kredileri:Nathan Laine / Bloomberg / Getty Images

Openai “unensor” chatgpt’e çalışır: Max, Openai’nin yapay zeka geliştirme yaklaşımını “entelektüel özgürlüğü” açıkça kucaklamak için nasıl değiştirdiğini yazdı, bir konu ne kadar zorlu veya tartışmalı olursa olsun.

Mira’nın Yeni Başlangıcı: Eski Openai CTO Mira Murati’nin yeni girişimi, Düşünme Makineleri Laboratuvarı“AI için çalışmasını sağlamak için araçlar oluşturmayı amaçlıyor [people’s] benzersiz ihtiyaçlar ve hedefler. “

GROK 3 COMETH: Elon Musk’un AI girişimi Xai, en son amiral gemisi AI modeli GROK 3’ü yayınladı ve iOS ve Web için GROK uygulamaları için yeni yetenekleri tanıttı.

Çok Llama Konferansı: Meta, bu bahar üretken AI’ya adanmış ilk geliştirici konferansına ev sahipliği yapacak. Llamacon olarak adlandırılan Meta’nın Lama üretken AI modelleri ailesinden sonra konferansın 29 Nisan’da yapılması planlanıyor.

AI ve Avrupa’nın dijital egemenliği: Paul, tüm AB dillerinin “dilsel ve kültürel çeşitliliğini” koruyan “Avrupa’da şeffaf yapay zeka için bir dizi temel model” oluşturmak için yaklaşık 20 kuruluş arasında bir işbirliği olan Openeurollm’i profilledi.

Haftanın Araştırma Raporu

Bir dizüstü bilgisayar ekranında görüntülenen openai chatgpt web sitesi bu illüstrasyon fotoğrafında görülür.
Resim Kredileri:Jakub Porzycki / Nurphoto / Getty Images

Openai araştırmacıları yeni bir yapay zeka ölçütü yarattı, Swe-kiracıbu güçlü AI sistemlerinin kodlama becerisini değerlendirmeyi amaçlamaktadır. Benchmark, hata düzeltmeleri ve özellik dağıtımlarından “yönetici düzeyinde” teknik uygulama önerilerine kadar değişen 1.400’den fazla serbest yazılım mühendisliği görevinden oluşmaktadır.

Openai’ye göre, en iyi performans gösteren AI modeli olan Antropic’in Claude 3.5 sonnet’i, tam SWE-kiracı ölçütünde% 40,3 puan alıyor-bu da AI’nın gidecek bir yol olduğunu gösteriyor. Araştırmacıların Openai’nin O3-Mini veya Çin AI şirketi Deepseek’in R1 gibi daha yeni modellerini karşılaştırmadıklarını belirtmek gerekir.

Haftanın Modeli

Stepfun adlı bir Çinli AI şirketi “açık” bir AI modeli yayınladı, ADIM-AUDIOçeşitli dillerde konuşmayı anlayabilir ve oluşturabilir. Step-Audio, Çince, İngilizce ve Japonca’yı destekler ve kullanıcıların şarkı söylemek de dahil olmak üzere oluşturduğu sentetik sesin duygularını ve hatta lehçesini ayarlamasına olanak tanır.

Stepfun, izinli bir lisans altında modelleri serbest bırakan iyi finanse edilen birkaç Çinli AI girişiminden biridir. 2023 yılında kurulan Stepfun Bildirildiğine göre son zamanlarda kapalı Çin devlete ait özel sermaye firmalarını içeren bir dizi yatırımcıdan birkaç yüz milyon dolar değerinde bir finansman.

Çanta

Nous Araştırma Deephermes
Resim Kredileri:Nous araştırma

Bir AI araştırma grubu olan Nous Research, piyasaya sürülmüş İddia ettiği şey, akıl yürütmeyi ve “sezgisel dil modeli yeteneklerini” birleştiren ilk AI modellerinden biridir.

Model, Deephermes-3 önizlemesi, bazı hesaplamalı yığınların pahasına iyileştirilmiş doğruluk için uzun “düşünce zincirleri” ni açabilir ve kapatabilir. “Akıl yürütme” modunda, diğer akıl yürütme yapay zeka modellerine benzer şekilde Deephermes-3 önizlemesi, daha zor problemler için daha uzun süre “düşünüyor” ve düşünce sürecinin cevaba ulaşmasını gösteriyor.

Antropic’in yakında mimari olarak benzer bir model yayınlamayı planladığı bildirildi ve Openai, böyle bir modelin yakın vadeli yol haritasında olduğunu söyledi.



genel-24

90 Günlük Nişanlısının Christian’ı, Cleo’nun Son Derece Rahatsız Edici Mesajı Yayınladıktan Sonra Büyük Güncelleme Verdi
LastPass ana şifrenizi değiştirmek isteyebilirsiniz
Founders Factory, Syndi Health’i 1,7 milyon sterlinlik tohum öncesi turda destekliyor
HBO, House of the Dragon Prömiyerini YouTube’da Ücretsiz Olarak Sunuyor
UnitedHealth, Change Healthcare veri ihlalinden 190 milyon Amerikalının etkilendiğini doğruladı
ETİKETLENDİ:#elon muskAIDABelkiBu hafta AI bültenindebu hafta AI'dagelmeliyizgörmezdenHaftaKriterleriniOpenAIŞimdilikxai
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Güncelleme Boyalı mı? Samsung kullanıcıları hala Android 15’i bekliyor
Sonraki Makale Maybach ve Rolls-Royce’un yerine dünyanın ilk pilini 800 V) aldı. Maextro S800’ü şarj etmek birkaç dakika sürer

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Apple ürünleri için bu yılki Prime Day indirimleri muhteşem
Liste
Sonic’in Yeni Kaos Avı Oyunu: Atlamamanız Gereken Detaylar
Oyun
Kritik: Xolis Sağlık Teknolojileri 1.4 Milyon Kişinin Verilerini Sızdırdı
Siber Güvenlik
2026 Amazon Prime Günü İndirimleri: Tushy Bidet 100$ Altında!
Genel
Hindistan’ın MoEngage’i Pazarlamanın Geleceği: Milyonlarca AI Ajanı
Genel
Acer’ın 4TB GM7 PCIe 4.0 SSD’si Prime Günü’nde 470$’a düştü
Donanım
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?