Artık hemen hemen her endüstri ve şirkette önemli bir teknoloji olan makine öğrenimi ve yapay zeka alanındaki araştırmalar, herkesin hepsini okuması için çok hacimlidir. Perceptron adlı bu sütun, özellikle yapay zeka konusunda, ancak bununla sınırlı olmamak üzere, en güncel keşiflerden ve makalelerden bazılarını toplamayı ve neden önemli olduklarını açıklamayı amaçlıyor.

Geçtiğimiz birkaç hafta içinde bilim adamları, Ay’ın loş ışıklı – ve bazı durumlarda zifiri karanlık – asteroit kraterleri hakkında büyüleyici ayrıntıları ortaya çıkarmak için bir algoritma geliştirdiler. Başka yerlerde, MIT araştırmacıları, belirli bir dilin kurallarını bağımsız olarak çözüp çözemeyeceğini görmek için ders kitaplarında bir AI modeli eğitti. DeepMind ve Microsoft’taki ekipler, robotlara yürüme gibi belirli görevleri nasıl gerçekleştireceklerini öğretmek için hareket yakalama verilerinin kullanılıp kullanılamayacağını araştırdı.

Artemis I’in beklemede olan (ve tahmin edilebileceği gibi ertelenen) lansmanı ile ay bilimi yeniden ilgi odağı oldu. Bununla birlikte, ironik bir şekilde, sayısız amaç için kullanılabilecek su buzu barındırabileceğinden, potansiyel olarak en ilginç olan Ay’ın en karanlık bölgeleridir. Karanlığı tespit etmek kolay, ama orada ne var? Uluslararası bir görüntü uzmanlarından oluşan ekip, soruna makine öğrenimi uyguladı ve bir miktar başarılı oldu.

Kraterler en derin karanlıkta olsa da, Lunar Reconnaissance Orbiter hala ara sıra fotonları içeriden yakalar ve ekip, yıllarca bu az pozlanmış (ancak tamamen siyah olmayan) pozları “fizik tabanlı, derin öğrenmeye dayalı bir post-işleme ile bir araya getirdi. alet” Jeofizik Araştırma Mektuplarında açıklanan. Sonuç olarak, “artık kalıcı olarak gölgelenmiş bölgelere giden görünür rotalar tasarlanabilir, bu da Artemis astronotları ve robotik kaşifler için riskleri büyük ölçüde azaltır”. Lunar and Planetary enstitüsünden David Kring’e göre.

Işık olsun! Kraterin içi başıboş fotonlardan yeniden oluşturuldu.

El fenerlerine sahip olacaklarını hayal ediyoruz, ancak önceden nereye gidileceği konusunda genel bir fikre sahip olmak iyidir ve elbette bu, robotik keşiflerin veya iniş yapanların çabalarını nereye odakladığını etkileyebilir.

Ne kadar kullanışlı olursa olsun, seyrek verileri bir görüntüye dönüştürmenin gizemli bir yanı yoktur. Ancak dilbilim dünyasında yapay zeka, dil modellerinin gerçekten bildiklerini nasıl ve gerçekten bilip bilmedikleri konusunda büyüleyici ilerlemeler sağlıyor. Bir dilin dilbilgisini öğrenme durumunda, bir MIT deneyi, birden fazla ders kitabı üzerinde eğitilmiş bir modelin, belirli bir dilin nasıl çalıştığına dair kendi modelini oluşturabildiğini, örneğin Lehçe dilbilgisinin, ders kitabı problemlerini başarılı bir şekilde yanıtlayabildiği noktaya kadar gelebildiğini buldu. hakkında.

“Dilbilimciler, bir insan dilinin kurallarını gerçekten anlamak, sistemi harekete geçiren şeyin ne olduğunu anlamak için insan olmanız gerektiğini düşündüler. İnsanların (dilbilimcilerin) göreve getirdiği bilgi ve akıl yürütme türlerini taklit edip edemeyeceğimizi görmek istedik.” MIT’den Adam Albright bir haber bülteninde söyledi. Bu cephede çok erken bir araştırmadır, ancak ince veya gizli kuralların, içlerinde açık talimat olmadan AI modelleri tarafından “anlaşılabileceğini” göstermesi umut vericidir.

Ancak deney, AI araştırmasında doğrudan kilit, açık bir soruyu ele almadı: dil modellerinin toksik, ayrımcı veya yanıltıcı dil çıkarmasını nasıl önleyebiliriz. Yeni DeepMind dışında yapmak dil modellerini insani değerlerle hizalama sorununa felsefi bir yaklaşım benimseyerek bunu ele alın.

Laboratuardaki araştırmacılar, daha iyi dil modelleri için “herkese uyan tek bir” yol olmadığını, çünkü modellerin, uygulandıkları bağlamlara bağlı olarak farklı özellikleri içermesi gerektiğini öne sürüyorlar. Örneğin, bilimsel araştırmaya yardımcı olmak için tasarlanmış bir model ideal olarak yalnızca doğru ifadelerde bulunurken, kamuya açık bir tartışmada moderatör rolünü oynayan bir temsilci hoşgörü, nezaket ve saygı gibi değerleri uygular.

Peki bu değerler bir dil modeline nasıl aşılanabilir? DeepMind ortak yazarları belirli bir yol önermez. Bunun yerine, modellerin zaman içinde adlandırdıkları süreçler aracılığıyla daha “sağlam” ve “saygılı” konuşmalar geliştirebileceğini ima ederler. bağlam yapısı ve açıklama. Ortak yazarların açıkladığı gibi: “Bir kişi belirli bir konuşma pratiğini yöneten değerlerin farkında olmasa bile, temsilci, konuşmada onları önceden şekillendirerek, iletişimin gidişatını daha derin ve daha verimli hale getirerek, insanın bu değerleri anlamasına yardımcı olabilir. insan konuşmacı.”

LaMDA

Google’ın bir soruya yanıt veren LaMDA dil modeli.

Dil modellerini hizalamak için en umut verici yöntemleri ortaya çıkarmak, hem finansal hem de başka türlü çok zaman ve kaynak gerektirir. Ancak dilin ötesindeki alanlarda, özellikle bilimsel alanlarda, Ulusal Bilim Vakfı’nın (NSF) Chicago Üniversitesi, Argonne Ulusal Laboratuvarı ve Argonne Ulusal Laboratuvarı’ndan bir bilim insanı ekibine verdiği 3,5 milyon dolarlık hibe sayesinde, durum çok daha uzun süre böyle olmayabilir. MİT.

NSF hibesiyle, alıcılar “model bahçeler” olarak tanımladıkları şeyleri veya fizik, matematik ve kimya gibi alanlardaki sorunları çözmek için tasarlanmış AI modellerinin depolarını inşa etmeyi planlıyorlar. Depolar, doğruluğunu doğrulamak için modelleri veri ve bilgi işlem kaynaklarıyla ve otomatik testler ve ekranlarla ilişkilendirecek ve ideal olarak bilimsel araştırmacıların araçları kendi çalışmalarında test etmelerini ve kullanmalarını kolaylaştıracak.

“Bir kullanıcı şuraya gelebilir: [model] bahçe ve tüm bu bilgileri bir bakışta görün”, Globus Labs’ta projeye dahil olan bir veri bilimi araştırmacısı olan Ben Blaiszik, söz konusu bir basın bülteninde. “Modele atıfta bulunabilirler, model hakkında bilgi edinebilirler, yazarlarla iletişim kurabilirler ve modeli kendileri bir web ortamında, liderlik bilgi işlem tesislerinde veya kendi bilgisayarlarında çağırabilirler.”

Bu arada, robotik alanında, araştırmacılar yazılımla değil, donanımla – tam olarak nöromorfik donanımla AI modelleri için bir platform oluşturuyorlar. Intel iddialar Deneysel Loihi çipinin en son nesli, bir nesne tanıma modelinin daha önce hiç görmediği bir nesneyi tanımlamayı “öğrenmesini”, modelin bir CPU üzerinde çalışmasına göre 175 kata kadar daha az güç kullanarak yapmasını sağlayabilir.

Intel nöromorfik

Intel’in deneysel nöromorfik çiplerinden biriyle donatılmış insansı bir robot.

Nöromorfik sistemler, sinir sistemindeki biyolojik yapıları taklit etmeye çalışır. Geleneksel makine öğrenme sistemleri ya hızlı ya da güç açısından verimli olsa da, nöromorfik sistemler, bilgileri işlemek için düğümleri ve analog devre kullanarak elektrik sinyallerini aktarmak için düğümler arasındaki bağlantıları kullanarak hem hız hem de verimlilik elde eder. Sistemler, düğümler arasında akan güç miktarını modüle ederek her bir düğümün işleme yapmasına izin verebilir – ancak bu yalnızca gerektiğinde.

Intel ve diğerleri, nöromorfik hesaplamanın lojistikte uygulamaları olduğuna inanıyor, örneğin üretim süreçlerine yardımcı olmak için yapılmış bir robota güç sağlamak. Bu noktada teorik – nöromorfik hesaplamanın dezavantajları var – ama belki bir gün bu vizyon gerçekleşecek.

DeepMind yerleşik yapay zeka

Resim Kredisi: Derin Düşünce

Gerçekliğe daha yakın olan DeepMind’in son “Bedenlenmiş zeka” ya da robotlara top sürmeyi, kutu taşımayı ve hatta futbol oynamayı öğretmek için insan ve hayvan hareketlerini kullanmak. Laboratuardaki araştırmacılar, insanlar ve hayvanlar tarafından giyilen hareket izleyicilerden gelen verileri kaydetmek için bir kurulum tasarladılar ve bundan bir yapay zeka sistemi, dairesel bir harekette nasıl yürüneceği gibi yeni eylemlerin nasıl tamamlanacağını öğrenmeyi öğrendi. Araştırmacılar, bu yaklaşımın gerçek dünyadaki robotlara iyi yansıdığını, örneğin dört ayaklı bir robotun bir köpek gibi yürümesine ve aynı anda bir top sürmesine izin verdiğini iddia ediyor.

Tesadüfen, Microsoft bu yazın başlarında piyasaya sürülmüş İnsanlar gibi yürüyebilen robotlara yönelik araştırmaları teşvik etmeyi amaçlayan bir hareket yakalama verileri kütüphanesi. MoCapAct olarak adlandırılan kitaplık, diğer verilerle kullanıldığında, en azından simülasyonda çevik iki ayaklı robotlar oluşturmak için kullanılabilen hareket yakalama klipleri içerir.

“[Creating this data set] GPU ile donatılmış birçok GPU’ya göre 50 yıl eşdeğerini aldı [servers] … MoCapAct’in diğer araştırmacılar için ortadan kaldırdığı hesaplama engelinin bir kanıtı”, çalışmanın ortak yazarları bir blog yazısında yazdı. “Topluluğun veri kümemizi geliştirebileceğini ve insansı robotların kontrolünde inanılmaz araştırmalar yapmak için çalışacağını umuyoruz.”

Bilimsel makalelerin emsal incelemesi paha biçilmez bir insan işidir ve yapay zekanın bunu devralması pek olası değildir, ancak aslında meslektaş incelemelerinin gerçekten yararlı olduğundan emin olmaya yardımcı olabilir. İsviçreli bir araştırma grubu, akran incelemelerinin modele dayalı değerlendirmesi, ve erken sonuçları karışık – iyi bir şekilde. Açıkça iyi veya kötü bir yöntem veya eğilim yoktu ve yayın etki derecelendirmesi, bir incelemenin kapsamlı veya yararlı olup olmadığını öngörmüyordu. Yine de sorun değil, çünkü incelemelerin kalitesi farklılık gösterse de, örneğin büyük dergiler dışında her yerde sistematik bir iyi inceleme eksikliği olmasını istemezsiniz. Çalışmaları devam ediyor.

Son olarak, bu alandaki yaratıcılıkla ilgilenen herkes için, işte Karen X. Cheng’in kişisel projesi Bu, gerçekten orijinal bir şey üretmek için biraz yaratıcılık ve sıkı çalışmanın AI ile nasıl birleştirilebileceğini gösteriyor.





genel-24