Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: AWS, Bedrock LLM hizmetine hızlı yönlendirme ve önbelleğe alma özelliği getiriyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » AWS, Bedrock LLM hizmetine hızlı yönlendirme ve önbelleğe alma özelliği getiriyor

Liste

AWS, Bedrock LLM hizmetine hızlı yönlendirme ve önbelleğe alma özelliği getiriyor

teknomers
Son güncelleme: 4 Aralık 2024 20:54
teknomers
Paylaş
Paylaş


İşletmeler, sınırlı prototiplerde üretken yapay zekayı denemekten bunları üretime geçirmeye geçtikçe, fiyat konusunda giderek daha bilinçli hale geliyorlar. Sonuçta büyük dil modellerini kullanmak ucuz değil. Maliyeti azaltmanın bir yolu eski bir kavrama geri dönmektir: önbelleğe alma. Bir diğeri ise daha basit sorguları daha küçük, daha uygun maliyetli modellere yönlendirmektir. AWS bugün Las Vegas’taki re:invent konferansında Bedrock LLM barındırma hizmeti için bu özelliklerin her ikisini de duyurdu.

Öncelikle önbellekleme hizmetinden bahsedelim. “Diyelim ki bir belge var ve birden fazla kişi aynı belge üzerinde sorular soruyor. Bedrock’un ürün müdürü Atul Deo bana “Her seferinde ödeme yapıyorsunuz” dedi. “Ve bu bağlam pencereleri giderek daha da uzuyor. Örneğin Nova ile 300 bine sahip olacağız [tokens of] bağlam ve 2 milyon [tokens of] bağlam. Gelecek yıl bu rakamın çok daha yüksek seviyelere çıkabileceğini düşünüyorum.”

Resim Kredisi:AWS

Önbelleğe alma, temel olarak modelin tekrarlayan işler yapması ve aynı (veya büyük ölçüde benzer) sorguları tekrar tekrar işlemesi için ödeme yapmanıza gerek kalmamasını sağlar. AWS’ye göre bu, maliyeti %90’a kadar azaltabilir ancak bunun ek bir yan ürünü de modelden yanıt alma gecikmesinin önemli ölçüde daha düşük olmasıdır (AWS, %85’e kadar olduğunu söylüyor). Bedrock’taki bazı üretken yapay zeka uygulamaları için hızlı önbelleğe almayı test eden Adobe, yanıt süresinde %72’lik bir azalma gördü.

Diğer önemli yeni özellik ise Bedrock için akıllı yönlendirmedir. Bu sayede Bedrock, işletmelerin performans ve maliyet arasında doğru dengeyi kurmasına yardımcı olmak için istemleri aynı model ailesindeki farklı modellere otomatik olarak yönlendirebilir. Sistem, her modelin belirli bir sorgu için nasıl performans göstereceğini (küçük bir dil modeli kullanarak) otomatik olarak tahmin eder ve ardından isteği buna göre yönlendirir.

Resim Kredisi:AWS

“Bazen sorgum çok basit olabiliyor. Bu sorguyu gerçekten son derece pahalı ve yavaş olan en yetenekli modele göndermem gerekiyor mu? Muhtemelen hayır. Yani temel olarak ‘Hey, çalışma zamanında, gelen istemi temel alarak doğru sorguyu doğru modele gönder’ fikrini yaratmak istiyorsunuz” diye açıkladı Deo.

LLM yönlendirme elbette yeni bir kavram değil. gibi girişimler Marslı ve bir dizi açık kaynak projesi de bu sorunun üstesinden geliyor, ancak AWS muhtemelen teklifini farklı kılan şeyin, yönlendiricinin çok fazla insan girişi olmadan sorguları akıllıca yönlendirebilmesi olduğunu iddia edecektir. Ancak sorguları yalnızca aynı model ailesindeki modellere yönlendirebilmesi nedeniyle de sınırlıdır. Ancak Deo bana uzun vadede ekibin bu sistemi genişletmeyi ve kullanıcılara daha fazla kişiselleştirilebilirlik sağlamayı planladığını söyledi.

Resim Kredisi:AWS

Son olarak AWS, Bedrock için yeni bir pazar yeri de başlatıyor. Deo’ya göre buradaki fikir, Amazon’un daha büyük model sağlayıcıların çoğuyla ortaklık yapmasına rağmen, artık yalnızca birkaç özel kullanıcıya sahip olabilecek yüzlerce özel modelin var olmasıdır. Bu müşteriler şirketten bunları desteklemesini istediğinden, AWS bu modeller için bir pazar başlatıyor; buradaki tek büyük fark, kullanıcıların altyapılarının kapasitesini kendilerinin tedarik etmesi ve yönetmesi gerektiğidir; Bedrock bunu genellikle otomatik olarak yönetir. AWS, bu yeni ortaya çıkan ve özel modellerden toplamda yaklaşık 100 adet sunacak ve daha fazlası da gelecek.



genel-24

Vir Das Landing: Yeni Stand-Up Özel Setleri 26 Aralık’ta Netflix’te Yayın Tarihi
Apple, yapay zeka modellerini daha küçük ve daha hızlı hale getiren girişime son veriyor
Her zamankinden daha fazla eyalette obezite oranları yüksek
Apple neden ‘Silo’nun ilk bölümünün tamamını Twitter’a yükledi?
Showrunner, The Last Man Resmen Öldüğünü Söyledi
ETİKETLENDİ:ah 2024'ü yeniden icat etmekalmaAna kayaAWSBedrockgetiriyorhizmetineHızlıLLMönbelleğeözelliğiYönlendirme
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Unkurtları Plastik Yiyebilir, Ancak Araştırma Kirlilik Krizi Üzerindeki Etkisinin Sınırlı Olduğunu Gösteriyor
Sonraki Makale Severance’ın Yaratıcıları 2. Sezon İçin Çok Çok Uzun Süreyi Açıklıyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Anthropic Yeni Modellerine Erişimi Durdururken Hindistan’ın AI Geleceği Tartışılıyor
Genel
Meta’nın Beijing’e tepki olarak 2 milyar dolarlık anlaşmayı geri çektiği iddia edildi
Yapay Zeka
Mumbai’de Web Geliştirme Hizmetleri: HTML, CSS, PHP, Laravel, React ve Next.js
Yazılım
SteelSeries’ten Beklenen Eğlenceli South Park Oyun Aksesuarı
Oyun
Amazon güvenlik araştırması Beyaz Saray’ın Anthropic Fable yasağına neden oldu
Liste
Eski çalışan, eski işvereni hedef alan siber saldırılarla hapse girdi!
Siber Güvenlik
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?