Eşzamanlı ve Heterojen Çoklu İş Parçacığı (SHMT), bir cihazın CPU, GPU ve AI hızlandırıcısının gücünden aynı anda yararlanabilen bir çözüm olabilir. Kaliforniya Üniversitesi, Riverside. Makale, bu yeni çoklu iş parçacığı tekniğinin performansı iki katına çıkarabildiğini ve güç tüketimini yarıya indirebildiğini, bunun da dört kat verimlilik sağladığını iddia ediyor. Ancak bir kavram kanıtı olarak çok hızlı heyecanlanmayın; henüz başlangıç aşamasındadır.
Birçok cihaz, daha verimli bilgi işlem için işlemci çekirdeğini iki iş parçacığına bölen Eşzamanlı Çoklu İş Parçacığı (SMT) gibi çoklu iş parçacığı tekniklerini zaten kullanıyor. Ancak SHMT birden fazla cihazı kapsar: bir CPU, bir GPU ve en az bir yapay zeka destekli hızlandırıcı. Buradaki fikir, her işlemcinin aynı anda farklı şeyler üzerinde çalışmasını sağlamak ve hatta GPU ve AI kaynaklarını birden fazla göreve yaymaktır.
Hung-Wei Tseng ve Kuan-Chieh Hsu’nun yazdığı makaleye göre SHMT, performansı 1,95 kat artırabiliyor ve güç tüketimini %51 oranında azaltabiliyor. Bu sonuçlar, dört çekirdekli Cortex A57 Arm CPU, 4 GB LPDDR4 ve 128 çekirdekli GPU içeren Nvidia’nın Maxwell dönemi Jetson Nano’sunda kaydedildi. Ek olarak araştırmacılar, Jetson’un M.2 yuvasına yapay zeka hızlandırıcısı sağlamak için bir Google Edge TPU yerleştirdi; Jetson da bununla birlikte geliyor.
Araştırmacılar bu sonuca, kaliteye duyarlı bir iş çalma (QAWS) planlayıcısı oluşturarak ulaştılar. Temel olarak zamanlayıcı, yüksek hata oranlarını önleyecek ve iş yükünü tüm bileşenler arasında eşit şekilde dengeleyecek şekilde ayarlanmıştır. QAWS politikaları kapsamında, yüksek hassasiyet ve doğruluk gerektiren görevler, bazen hataya açık yapay zeka hızlandırıcılara atanmayacak ve performans beklentilerini karşılamayan görevler, diğer bileşenlere dinamik olarak yeniden atanacak.
İki kat performans, yarı güç ve dört kat verimlilikle işin ne olduğunu merak ediyor olabilirsiniz. Makaleye göre, “SHMT’nin sınırlaması modelin kendisi değil, daha çok programcının SHMT’nin istismarını kolaylaştıran paralellik türünü sergilemek için algoritmayı tekrar ziyaret edip edemeyeceğiyle ilgilidir.” Bu beyan, SHMT’den yararlanmak için yazılımın nasıl yazılması gerektiğine ve tüm yazılımların bunu maksimum etkiyle kullanamayacağına atıfta bulunur.
Yazılımı yeniden yazmanın zahmetli olduğu bilinir; örneğin Apple, Mac PC’ler için Intel’den şirket içi Arm çiplerine geçtiğinde çok fazla ayak işi yapmak zorunda kaldı. Özellikle çoklu iş parçacığıyla ilgili olarak, geliştiricilerin uyum sağlaması biraz zaman alabilir. Yazılımın çok çekirdekli CPU’lardan faydalanması birkaç yıl aldı ve geliştiricilerin aynı görev için birden fazla bileşeni kullanması için benzer bir zaman çizelgesine bakıyor olabiliriz.
Ek olarak makale, SHMT’nin performans artışının problem boyutuna nasıl bağlı olduğunu ayrıntılarıyla anlatıyor. 1,95 kat daha hızlı olan rakam, kağıdın test ettiği maksimum sorun boyutundan geliyor ancak daha küçük sorun boyutları, daha düşük performans kazancı anlamına geliyor. En düşük sorun boyutunda, aslında hiçbir performans avantajı yoktu çünkü daha düşük sorun boyutları, tüm bileşenlerin paralel çalışması için daha az fırsat sunuyordu.
Her türden bilgisayar, yapay zeka işlemcileri gibi birden fazla bilgi işlem cihazıyla giderek daha fazla birlikte gönderildiğinden, geliştiricilerin işleri hızlandırmak için daha fazla donanım kullanmak istemeleri muhtemelen kaçınılmazdır. SHMT, makalenin ana hatlarıyla belirttiği en iyi senaryoyu karşılamasa bile, kendisinin veya benzer bir teknolojinin ana akım ivme kazanması durumunda bilgisayarları ve akıllı telefonları güçlendirebilir.