Merhaba arkadaşlar, TechCrunch’ın düzenli AI bültenine hoş geldiniz. Bunu her Çarşamba gelen kutunuzda istiyorsanız, buradan kaydolun.

Üretken AI hakkında ne derseniz deyin. Ama metalaştırıyor – ya da en azından öyle görünüyor.

Ağustos ayının başlarında, hem Google hem de OpenAI, bütçe dostu metin oluşturma modellerinin fiyatlarını düşürdü. Google, Gemini 1.5 Flash için giriş fiyatını (modelin metni işleme maliyeti) %78 ve çıktı fiyatını (modelin metni oluşturma maliyeti) %71 oranında düşürdü. Bu arada OpenAI, GPT-4o için giriş fiyatını yarı yarıya, çıktı fiyatını ise üçte bir oranında düşürdü.

Birine göre tahmin etmekçıkarımın ortalama maliyeti — esasen bir modeli çalıştırmanın maliyeti — yıllık %86 oranında düşüyor. Peki bunu ne yönlendiriyor?

Birincisi, amiral gemisi modelleri yetenekler açısından birbirinden ayıracak çok fazla şey yok.

Constellation Research’ün baş analisti Andy Thurai bana şunları söyledi: “Benzersiz bir farklılaştırıcı yoksa tüm AI modellerinde fiyatlandırma baskısının devam etmesini bekliyoruz. Tüketim yoksa veya rekabet ivme kazanıyorsa, tüm bu sağlayıcıların müşterileri elinde tutmak için fiyatlandırma konusunda agresif olmaları gerekiyor.”

Gartner’da analist yardımcısı olan John Lovelock, emtialaşmanın Ve rekabet, model fiyatlarındaki son aşağı yönlü baskıdan sorumludur. Modellerin başlangıçtan itibaren maliyet artı temelinde fiyatlandırıldığını, başka bir deyişle, onları eğitmek için harcanan milyonlarca doları telafi edecek şekilde fiyatlandırıldığını belirtiyor (OpenAI’nin GPT-4 bildirildiğine göre maliyeti 78,4 milyon dolar) ve bunları çalıştırmanın sunucu maliyetleri (ChatGPT bir noktada maliyetlendirme OpenAI ~günlük 700.000$). Ancak artık veri merkezleri bir boyuta ve ölçeğe ulaştı — indirimleri desteklemek için.

Google, Anthropic ve OpenAI gibi satıcılar, ek tasarruf sağlamak için istem önbelleğe alma ve toplu işleme gibi teknikleri benimsedi. İstem önbelleğe alma, geliştiricilerin bir modele yapılan API çağrılarında yeniden kullanılabilen belirli “istem bağlamlarını” depolamasına olanak tanırken, toplu işleme düşük öncelikli (ve dolayısıyla daha ucuz) model çıkarım isteklerinin eşzamansız gruplarını işler.

Meta’nın Llama 3’ü gibi büyük açık model sürümlerinin de satıcı fiyatlandırması üzerinde etkisi olması muhtemeldir. Bunların en büyüğü ve en yeteneklisi çalıştırılması tam olarak ucuz olmasa da, bir işletmenin şirket içi altyapısında çalıştırıldığında maliyet açısından satıcıların teklifleriyle rekabet edebilir.

Soru şu: Fiyatlardaki düşüş sürdürülebilir mi?

Üretken AI satıcıları nakiti hızla tüketiyor. OpenAI’nin 5 milyar dolar kaybetme yolunda Bu yıl, rakip Anthropic’in bunun olacağını tahmin ettiği 2025 yılına kadar 2,7 milyar dolardan fazla açık.

Lovelock, yüksek sermaye harcamaları ve operasyonel maliyetlerin, tedarikçileri tamamen yeni fiyatlandırma yapıları benimsemeye zorlayabileceğini düşünüyor.

“Yeni nesil modellerin yaratılması için yüz milyonlarca dolara mal olacak maliyet tahminleri varken, maliyet artı fiyatlandırma tüketici için ne gibi sonuçlar doğuracak?” diye sordu.

Yakında öğreneceğiz.

Haberler

Musk SB 1047’yi destekliyor: X, Tesla ve SpaceX’in CEO’su Elon Musk, çok büyük yapay zeka modelleri üreticilerinin, bu modellerin ciddi zararlara yol açmasını önleyecek güvenlik önlemleri oluşturmasını ve belgelendirmesini gerektiren Kaliforniya’nın SB 1047 tasarısını desteklediğini açıkladı.

AI Overviews zayıf Hintçe konuşuyor: Ivan, Google’ın belirli arama sorgularına yanıt olarak yapay zeka tarafından üretilen yanıtlar veren Yapay Zeka Genel Bakış özelliğinin, yaz aylarında yenilebilecek bir şey olarak “yapışkan şeyler” önermek gibi Hintçede çok sayıda hata yaptığını yazıyor.

OpenAI, yapay zeka filigranlamasını destekliyor: OpenAI, Adobe ve Microsoft, teknoloji şirketlerinin AI tarafından üretilen içerikleri etiketlemesini gerektiren bir Kaliforniya yasa tasarısını destekledi. Max’in bildirdiğine göre yasa tasarısı Ağustos ayında nihai oylamaya sunulacak.

Bükülme Pi’ye büyük harf ekler: Kurucuları ve çalışanlarının büyük kısmı beş ay önce Microsoft tarafından işe alınan yapay zeka girişimi Inflection, şirketin odak noktasının kurumsal ürünlere kaymasıyla birlikte chatbot’u Pi’ye ücretsiz erişimi sınırlamayı planlıyor.

Stephen Wolfram Yapay Zeka Hakkında: Ron Miller, Wolfram Alpha’nın kurucusu Stephen Wolfram’la röportaj yaptı. Wolfram, yapay zekanın giderek artan etkisi ve ortaya çıkardığı tüm sorular nedeniyle felsefenin yeni bir “altın çağa” girdiğini düşünüyor.

Waymo çocukları yönlendiriyor: Alphabet’in yan kuruluşu Waymo’nun, gençlerin tek başlarına arabalarına binip, çocukların ebeveynlerine teslim alma ve bırakma uyarıları göndermelerine olanak tanıyan bir abonelik programı üzerinde çalıştığı bildiriliyor.

DeepMind çalışanları protesto ediyor: Google’ın Yapay Zeka Ar-Ge bölümü olan DeepMind’daki bazı çalışanlar Google’ın yapay zeka konusundaki kararlarından memnun değil. bildirildi savunma sözleşmeleri — ve bunu belirtmek için şirket içinde bir mektup dolaştırdıkları söyleniyor.

Yapay zeka girişimleri SVP alımlarını teşvik ediyor: Rebecca, VC’lerin en popüler yapay zeka şirketlerinin hisselerini ele geçirmek için çoğunlukla özel amaçlı araçlar (SVP) adı verilen finansal araçlar biçiminde, ikincil piyasadaki geç aşamadaki girişimlerin hisselerini giderek daha fazla satın aldığını yazıyor.

Haftanın araştırma makalesi

Daha önce yazdığımız gibi, birçok AI kıyaslaması bize pek bir şey söylemiyor. Çok basitler — veya ezoterikler. Ya da bunlarda bariz hatalar var.

Özellikle görsel-dil modelleri (VLM’ler) için daha iyi değerlendirmeler geliştirmeyi amaçlayan (yani hem fotoğrafları hem de metni anlayabilen modeller), Allen Yapay Zeka Enstitüsü’ndeki (AI2) ve diğer yerlerdeki araştırmacılar yakın zamanda şu adı verilen bir test tezgahı yayınladı: VahşiGörüş.

WildVision, Google’ın Gemini Pro Vision ve OpenAI’nin GPT-4o’su da dahil olmak üzere yaklaşık 20 modeli barındıran bir değerlendirme platformu ve insanların modellerle yaptığı sohbetlerdeki tercihlerini yansıtan bir liderlik tablosundan oluşuyor.

AI2 araştırmacıları, WildVision’ı geliştirirken en iyi VLM’lerin bile halüsinasyon gördüğünü ve bağlamsal ipuçları ve mekansal akıl yürütmeyle mücadele ettiğini bulduklarını söylüyorlar. “Kapsamlı analizimiz… VLM’leri ilerletmek için gelecekteki yönleri gösteriyor,” diye yazdılar kağıt test paketinin yayınlanmasına eşlik ediyor.

Haftanın modeli

Bu tam olarak bir model olmasa da Anthropic, bu hafta şirketin Claude modelleriyle yapılan görüşmeleri uygulamalara, grafiklere, gösterge panellerine, web sitelerine ve daha fazlasına dönüştüren Artifacts özelliğini tüm kullanıcılar için kullanıma sundu.

Haziran ayında önizleme olarak başlatılan Artifacts — artık web’de ve iOS ve Android için Anthropic’in Claude uygulamalarında ücretsiz olarak mevcut — Claude ile yaptığınız yaratımları gösteren özel bir pencere sunuyor. Kullanıcılar eserleri daha geniş toplulukla yayınlayabilir ve yeniden düzenleyebilirken, Anthropic’in Team planına abone olanlar eserleri daha kilitli ortamlarda paylaşabilir.

Anthropic’te ürün lideri olan Michael Gerstenhaber, TechCrunch’a verdiği bir röportajda Artifacts’ı şöyle tanımladı: “Artifacts, üretilen içeriği bir kenara koyan ve bir kullanıcı olarak bu içerik üzerinde yineleme yapmanıza olanak tanıyan model çıktısıdır. Diyelim ki kod üretmek istiyorsunuz – artifact kullanıcı arayüzüne konulacak ve ardından Claude ile konuşup belge üzerinde yineleme yaparak kodu çalıştırabilmeniz için iyileştirebilirsiniz.”

Dikkat edilmesi gereken nokta, Quora’nın abonelik tabanlı, Claude dahil AI modelleri için platformlar arası toplayıcısı olan Poe’nun, Artifacts’e benzer bir özelliğinin olmasıdır: Previews. Ancak Artifacts’in aksine, Previews ücretsiz değildir; Poe’nun premium planı için ayda 20$ ödemeniz gerekir.

Karışık çanta

OpenAI’nin kolunda bir Çilek olabilir.

Bu binaen The Information’a göre, şirketin mevcut modellerinden daha iyi mantık yürütebilen yeni bir AI ürünü piyasaya sürmeye çalıştığını bildiren Strawberry — daha önce Q* olarak adlandırılıyordu, geçen yıl sizin de yazdığınız gibi — daha önce görmediği karmaşık matematik ve programlama problemlerini ve The New York Times’ın Connections gibi kelime bulmacalarını çözebildiği söyleniyor.

Olumsuz tarafı ise “düşünmenin” daha fazla zaman alması. OpenAI’nin bugün en iyi modeli olan GPT-4o ile karşılaştırıldığında ne kadar daha uzun olduğu belirsiz.

OpenAI, bu sonbaharda potansiyel olarak yapay zeka destekli sohbet robotu platformu ChatGPT’de Strawberry ile aşılanmış bir model başlatmayı umuyor. Şirketin ayrıca, Orion kod adlı bir sonraki büyük modeli de dahil olmak üzere modelleri eğitmek için sentetik veri üretmek amacıyla Strawberry’yi kullandığı bildiriliyor.

Yapay zeka meraklısı çevrelerde Strawberry’den beklentiler çok yüksek. OpenAI bunları karşılayabilir mi? Söylemesi zor — ama en azından ChatGPT’nin yazım becerilerinde bir gelişme olmasını umuyorum.



genel-24