Çin’deki Tsinghua Üniversitesi’nden yeni bir makale, bilgisayarla görme görevlerinde uzmanlaşmış ultra hızlı ve yüksek verimli bir yapay zeka işleme çipinin geliştirilmesini ve çalışmasını anlatıyor. Elektronik ve Işık Hesaplamayı Birleştiren Tüm Analog Çip (ACCEL), çip olarak adlandırıldığı gibi, dört milyon kat daha fazla enerji tüketimiyle Nvidia A100’ün 3.000 katından fazla performans sunabilen özel bir mimaride fotonik ve analog bilgi işlemden yararlanıyor daha düşük. Evet, bu özel bir çip; ancak bunu pazarın parçalanması olarak görmek yerine, yarı iletkenlerin “her şeyi kapsayan” bir konfigürasyondan ziyade belirli bir ihtiyaca uyacak şekilde giderek daha fazla tasarlandığı heterojen bilgi işlemin geleceğine doğru atılmış bir adım olarak görebiliriz. .
Nature’da yayınlandığı üzere, ACCEL’in görüntü görevlerinde saniyede 4,6 trilyon işlem gerçekleştirdiği belirtiliyor; dolayısıyla Nvidia’nın A100 (Ampere) ve 0,312 katrilyon işlemine kıyasla 3.0000 kat performans artışı elde ediliyor. Araştırma makalesine göre ACCEL, 1 W güçte (araştırmacıların “sistemik enerji verimliliği” dediği şey) saniyede 74,8 katrilyon işlem ve saniyede 4,6 peta işlemlik hesaplama hızı gerçekleştirebiliyor. O zamandan beri Nvidia’nın A100’ünün yerini Hopper ve onun 80 milyar transistörlü H100 süper çipi aldı, ancak bu bile bu sonuçlar karşısında pek etkileyici görünmüyor.
Elbette herhangi bir işlem sisteminde hız çok önemlidir. Ancak bilgisayarlı görme görevleri için doğruluk gereklidir. Sonuçta, bu sistemlerin hayatlarımızı ve uygarlığımızı yönetmek için kullanıldığı uygulama ve yol yelpazesi oldukça geniştir: Giyilebilir cihaz pazarından (muhtemelen XR senaryolarında), otonom sürüşe, endüstriyel denetimlere ve diğer görüntü algılama ve tanıma sistemlerine kadar uzanır. yüz tanıma gibi genel. Tsinghua Üniversitesi’nin makalesi, ACCEL’in Fashion-MNIST, 3 sınıflı ImageNet sınıflandırması ve hızlandırılmış video tanıma görevlerine karşı “rekabet açısından yüksek” doğruluk seviyeleriyle (sırasıyla %85,5, %82,0 ve %92,6) deneysel olarak denendiğini söylüyor. Düşük ışık koşullarında üstün sistem sağlamlığı (her karede 0,14 fJ μm−2).
ACCEL durumunda, Tsinghua’nın mimarisi, tek bir çipte ölçeklenebilirlik, doğrusal olmama ve esneklik ile elektronik analog hesaplama (EAC) tarafından desteklenen kırınımlı optik analog hesaplama (OAC) aracılığıyla çalışır – ancak işleminin %99’u optik sistem içinde uygulanır. Makaleye göre bu, Mach-Zehnder interferometreleri ve kırınımlı Derin Sinir Ağları (DNN’ler) gibi diğer görüntü mimarilerinde bulunan kısıtlamalarla mücadelede yardımcı oluyor.
Bu %99’luk rakam, en azından ACCEL ve diğer analog olmayan yaklaşımlar arasındaki enerji verimliliği eşitsizliğini açıklamakla alakalıdır: Nvidia’nın GPU’su %100 dijitaldir, yani çalışması sürekli elektron akışına dayalıdır (ve atık ısı üretir). sonuç).
Ancak fotonik, optik bir sistem, bilgiyi aktarmanın, çalıştırmanın ve kodlamanın elektriksel olmayan yollarından yararlanır. Bu, belirli dalga boylarındaki lazer darbeleri yoluyla yapılabilir (bunu Çin’in Kuantum Anahtar Dağıtımı hakkındaki son makalemizde araştırdık). [QKD] görsel verinin (bir görüntünün) özelliklerini çıkarmak ve iletmek için kullanılan ve neredeyse hareket halindeyken bu ışıkla çalışan (onu değiştiren) bir uydu sistemi (aynı zamanda fotonik tabanlı). Bu optik işleme sisteminin bir sonucu olarak, daha az enerji gereksinimi vardır ve termal dağılım nedeniyle boşa harcanan elektronlar vardır. ADC’lerin (Analogdan Dijitale Dönüştürücüler) yüksek enerji ve gecikme maliyetinden kurtulmak, fotoniklerin ortaya çıkardığı performans iyileştirmelerine doğru uzun bir yol kat ediyor. Fotonik sistemlerin kuantum hesaplama ve HPC (Yüksek Performanslı Bilgi İşlem) kurulumlarında kullanılmasının nedeni de budur.
Eş zamanlı olarak, elektronların yarı iletkenler üzerindeki düzenli ama dağınık hareketinden uzaklaşmanın hız avantajlarından yararlanıyoruz ve yalnızca ışığın kendisiyle sınırlanan çalışma hızlarının kilidini açıyoruz. Sonuç olarak araştırma makalesi, çip üzerinde yapılan şirket içi testlerin, her karede 72 ns’de düşük hesaplama gecikmesi gösterdiğini iddia ediyor; bu da saniyede yaklaşık 13.000 karelik bir üretime yol açıyor; bu, herhangi bir Doom oyuncusunun gerçekliğin izini kaybetmesine yetecek kadar fazla. . Ayrıca herhangi bir bilgi işlem-görüntü görevinde bir ortak işlemcinin bu görüntülerin bir seçimini analiz etmesi için yeterli çerçeve olacak gibi görünüyor. Bu görüntülerin ACCEL aracılığıyla derin öğrenmeyle işlenmesi bir darboğaz oluşturacak gibi görünmüyor.
ACCEL, Uygulamaya Özel Entegre Devre (ASIC) tasarımının analog bir versiyonu gibi görünüyor. Belirli görevleri hızlandırmak için içindeki analog yolları yeniden yapılandırabilen elektronik analog hesaplama (EAC) biriminin rolü tam olarak budur. Bunları, EAC’nin hangi konfigürasyonun hangi göreve uygulanması gerektiğini koordine ettiği, çip içindeki önceden programlanmış algoritmalar olarak düşünün.
Araştırma ekibinin eş liderlerinden Dai Qionghai şunları söyledi: “Yapay zeka çağı için yeni bir bilgi işlem mimarisi geliştirmek, zirveye ulaşmış bir başarıdır. Ancak daha önemli olan zorluk, bu yeni mimariyi pratik uygulamalara taşımak, önemli ulusal ve kamusal ihtiyaçları çözmektir ki bu da bizim sorumluluğumuzdur.”
Yeni ACCEL çipinin fotonik ve analog olması, IBM’in yakın zamanda başka bir analog yapay zeka hızlandırma çipinin (Hermes) duyurusunu akla getirebilir. Çin’e tüm yaptırımların uygulanmasına rağmen, ülkenin araştırma ve geliştirme çalışmalarının, engellendiği şey ne olursa olsun, onu yakalamasına ve bazı açılardan görünüşe göre iyileştirmesine olanak tanıdığına tanık olmak belki de ilginç olabilir. Yaratıcılık Sınırlamaların etrafından dolaşabilmek şüphesiz Çin’in yaptırımlar hakkında düşünme şeklidir.
Bu nesil fotonik tabanlı analog çipler üzerinde son derece rahat litografi seviyelerinde çalışıldığını anlamak da önemlidir. Örneğin ACCEL, operasyonun beyni olan Elektronik Analog Hesaplama birimi (EAC) için standart 180 nm CMOS teknolojisiyle üretildi. Doğal olarak, sürecin daha düşük CMOS düğümlerine doğru daha da minyatürleştirilmesiyle daha fazla performans, saat frekansı ve verimlilik iyileştirmeleri elde edilebilir (Nvidia’nın H100’ü 4 nm’lik bir işlemle üretilmiştir). Optik Analog Hesaplama (OAC) modülünü küçültmek için daha fazla ne tür çalışmalar yapılabileceği belli değil.
Görünüşe göre ACCEL gibi analog bilgi işlem sistemlerinin geniş ölçekte uygulanması, fiziksel imkansızlıktan ziyade üretim verimi ve endüstriye uyum meselesidir. Ancak yüksek performanslı yapay zeka analog çiplerinin hâlâ geniş ölçekte kullanılmamasının bir nedeni var: Üretimleri şu anda araştırma çabaları ve prototip çalışma dışında herhangi bir şeye hizmet edemeyecek kadar düşük. Artık, bu çipleri TSMC gibi şirketlerin 2025’e kadar taahhüt etmiş oldukları üretim taahhütlerine eklemek için gereken üretim miktarına veya mevcut kapasiteye sahip değiliz; ancak herhangi bir şeyi ölçeklendirme taahhüdünde bulunmadan önce bu deneysel sonuçlara her zaman ihtiyaç duyulmaktadır. Ve bunun gibi çiplere yönelik piyasalar bunlara sahip olmayı çok ister. Sonuçta her şey planlama, harcama ve zaman meselesi.