Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Derin Bilim: Vizyon ve dili birleştirmek, daha yetenekli yapay zekanın anahtarı olabilir
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Derin Bilim: Vizyon ve dili birleştirmek, daha yetenekli yapay zekanın anahtarı olabilir

Liste

Derin Bilim: Vizyon ve dili birleştirmek, daha yetenekli yapay zekanın anahtarı olabilir

teknomers
Son güncelleme: 10 Nisan 2022 20:42
teknomers
Paylaş
Paylaş


Abone olduğunuz zeka teorisine bağlı olarak, “insan düzeyinde” yapay zekaya ulaşmak, dünya hakkında akıl yürütmek için birden fazla modaliteden (örneğin ses, görüntü ve metin) yararlanabilen bir sistem gerektirecektir. Örneğin, karlı bir otoyolda devrilen bir kamyonun ve bir polis kruvazörünün görüntüsü gösterildiğinde, insan seviyesindeki bir yapay zeka, tehlikeli yol koşullarının bir kazaya neden olduğu sonucunu çıkarabilir. Veya bir robot üzerinde koşarken, buzdolabından bir kutu gazoz almaları istendiğinde, kutuyu almak ve talep edenin ulaşabileceği bir yere yerleştirmek için insanlar, mobilyalar ve evcil hayvanlar arasında gezinirlerdi.

Günümüzün yapay zekası yetersiz kalıyor. Ancak yeni araştırmalar, temel komutları (örneğin, “su şişesi al”) yerine getirmek için adımları çözebilen robotlardan açıklamalardan öğrenen metin üreten sistemlere kadar cesaret verici ilerleme işaretleri gösteriyor. Yapay zeka ve daha geniş bilimsel alandaki en son gelişmeler hakkında haftalık serimiz olan Deep Science’ın bu yeniden canlandırılmış baskısında, dünyayı tam olarak anlamasa bile – sistemlere doğru ilerleme kaydeden DeepMind, Google ve OpenAI çalışmalarını ele alıyoruz. Etkileyici sağlamlıkta görüntüler oluşturmak gibi dar görevleri çözün.

AI araştırma laboratuarı OpenAI’nin geliştirilmiş DALL-E, DALL-E 2, bir AI araştırma laboratuarının derinliklerinden ortaya çıkan en etkileyici projedir. Meslektaşım Devin Coldewey’in yazdığı gibi, orijinal DALL-E hemen hemen her komutla (örneğin, “bere takan bir köpek”) eşleşen görüntüler oluşturma konusunda olağanüstü bir hüner sergilemiş olsa da, DALL-E 2 bunu daha da ileri götürüyor. Ürettiği görüntüler çok daha ayrıntılıdır ve DALL-E 2 bir görüntüdeki belirli bir alanı akıllıca değiştirebilir – örneğin, uygun yansımalarla dolu mermer bir zeminin fotoğrafına bir masa ekleyerek.

DALL-E 2’nin oluşturabileceği görüntü türlerine bir örnek.

DALL-E 2 bu hafta en çok ilgiyi gördü. Ancak Perşembe günü, Google’daki araştırmacılar, Metin-Konuşma için Görsel Yönelimli Prosody adlı eşit derecede etkileyici bir görsel anlama sistemini ayrıntılı olarak anlattılar. VDT’ler – Google’ın AI blogunda yayınlanan bir gönderide. VDTTS, konuşan kişinin metin ve video karelerinden başka bir şey verilmeden gerçekçi sesli, dudak senkronizasyonlu konuşma üretebilir.

VDTTS’nin oluşturduğu konuşma, kaydedilen diyalog için mükemmel bir yedek olmasa da, inandırıcı bir şekilde insan benzeri ifade ve zamanlama ile hala oldukça iyidir. Google, bir gün, gürültülü koşullarda kaydedilmiş olabilecek orijinal sesin yerini almak için bir stüdyoda kullanıldığını görüyor.

Elbette görsel anlayış, daha yetenekli yapay zekaya giden yolda sadece bir adımdır. Diğer bir bileşen, AI’nın iyi belgelenmiş toksisite ve önyargı sorunlarını bir kenara bırakarak, birçok açıdan geride kalan dil anlayışıdır. Kesin bir örnekte, Google’ın son teknoloji ürünü Pathways Language Model (PaLM), bir makaleye göre onu “eğitmek” için kullanılan verilerin %40’ını ezberledi ve PaLM’nin metinden telif hakkı bildirimlerine kadar intihal yapmasına neden oldu. kod parçacıkları.

Neyse ki, Alphabet tarafından desteklenen AI laboratuvarı DeepMind, bunu ele almak için teknikleri araştıranlar arasında. yeni bir çalışmakDeepMind araştırmacıları, mevcut metinlerin birçok örneğinden (düşünce kitapları ve sosyal medya) metin oluşturmayı öğrenen AI dil sistemlerinin, açıklamalar bu metinlerden. Düzinelerce dil görevine (örneğin, “İkinci cümlenin birinci, mecazi cümlenin uygun bir başka deyişle olup olmadığını belirleyerek cevap verin”) açıklamalarla (örneğin, “David’in gözleri kelimenin tam anlamıyla hançer değildi, bu bir metafordur. David’in Paul’e sert bir şekilde baktığını ima ediyor.”) ve farklı sistemlerin üzerlerindeki performansını değerlendiren DeepMind ekibi, örneklerin gerçekten de sistemlerin performansını iyileştirdiğini buldu.

DeepMind’in yaklaşımı, akademik camiada kabul görürse, bir gün robotikte uygulanabilir ve adım adım talimatlar olmadan belirsiz istekleri (örneğin, “çöpü dışarı at”) anlayabilen bir robotun yapı taşlarını oluşturarak. Google’ın yeni “Söylediğimi Değil Yapabildiğimi Yap” projesi, önemli sınırlamalara rağmen bu geleceğe bir bakış sunuyor.

Google’daki Robotics ile Alphabet’in X laboratuvarındaki Do As I Can, Not As I Say adlı ortak çalışma, yapay zeka dil sistemini bir robot için “uygulanabilir” ve “bağlamsal olarak uygun” eylemler önermek üzere koşullandırmayı amaçlar. görev. Robot, dil sisteminin “elleri ve gözleri” olarak hareket ederken, sistem görev hakkında üst düzey anlamsal bilgi sağlar – teori, dil sisteminin robot için yararlı olan çok sayıda bilgiyi kodlamasıdır.

Google robotik

Resim Kredisi: Google’da Robotik

SayCan adlı bir sistem, bir komuta yanıt olarak robotun hangi beceriyi gerçekleştirmesi gerektiğini seçer ve (1) belirli bir becerinin yararlı olma olasılığını ve (2) söz konusu beceriyi başarıyla uygulama olasılığını hesaba katar. Örneğin, “Kolamı döktüm, temizlemek için bana bir şey getirir misin?” diyen birine SayCan, robotu sünger bulması, süngeri alması ve isteyen kişiye getirmesi için yönlendirebilir. O.

SayCan, robotik donanımla sınırlıdır – birden fazla durumda, araştırma ekibi robotun yanlışlıkla nesneleri düşürerek deneyler yapmayı seçtiğini gözlemledi. Yine de, DALL-E 2 ve DeepMind’in bağlamsal anlama konusundaki çalışmaları ile birlikte, bir araya getirildiğinde AI sistemlerinin bizi nasıl daha da yakınlaştırabileceğinin bir örneğidir. Jetsons tipi gelecek.



genel-24

Gigabyte’ın Wi-Fi 7 PCIe kartı masaüstünüzü daha hızlı bir kablosuz geleceğe hazırlıyor
Telegram kullanıcıları, uygulamanızı güncellemek için 4 neden olabilir
Apple Haritalar’ın bisikletle yol tarifi özelliği Chicago, Detroit ve diğer ABD şehirlerine yayılıyor
Google yöneticisi, çeşitliliği artırmak için işe alım sürecini yavaşlattığını söylüyor
Hollywood’un yapay zeka konusunda ne yapacağını bilmediği aşikar.
ETİKETLENDİ:anahtarıBilimbirleştirmekDahaderindiliolabilirvizyonYapayyeteneklizekanın
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Kingdom Hearts 4 Star Wars fragmanında görüntülendi
Sonraki Makale Pixel 6 kullanıcısı, Face Unlock ile bir güncellemenin yakında gelebileceğine dair kanıtları paylaşıyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Meta, Akıllı Gözlüklerindeki Yüz Tanıma Sistemini Kaldırdı!
Genel
WWDC 2026: Siri, iOS 27 ve Apple İnovasyonları Açıklandı
Yapay Zeka
Yeni ABD AI veri merkezleri su sıkıntısı çeken bölgelerde inşa ediliyor
Donanım
Yeni Noob Incremental Kodlarıyla Oyun Deneyiminizi Geliştirin
Oyun
NotebookLM ile Sohbetten Kaynak Deposu Oluşturmanın Yolu Açılıyor
Genel
Apple iOS 27’yi Duyurdu: Yenilikler ve Özellikler Neler?
Liste
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?