Intel Arc A380, tarihteki en kötü grafik kartı lansmanlarından biri olmalı – mutlaka donanımın kendisi değil, donanımın perakende lansmanı. Tüm göstergelere göre Intel, donanım bu yılın başlarında piyasaya sürülmeye hazır olduğunda sürücülerin bozulduğunu biliyordu. Perakende lansmanından önce sürücüleri düzeltmek için yeterli zaman ayırmak yerine ve yeni AMD ve Nvidia GPU’ları ufukta olduğu için saat ilerliyorken Intel, Arc GPU’larını ilk olarak Çin’e göndermeye karar verdi – muhtemelen bir şirketin yapacağı türden bir yaklaşım değil. ürün listemizi yapmaya layık olsaydı en iyi grafik kartları.
Birkaç ay sonra, diğer kıyılara giden GPU’ların pek çok olumsuz tanıtımından ve çok sayıda sürücü güncellemesinin gelip gitmesinin ardından, Arc A380 resmi olarak ABD’de 139 dolardan başlayan fiyatlarla piyasaya sürüldü (yeni sekmede açılır). Newegg’deki tek teklif tükendi ve şu anda yeniden sipariş verildi, ancak bu muhtemelen yüksek talepten ziyade sınırlı tedarikle ilgili. Yine de A380 o kadar da kötü değil ve Team Blue’nun 24 yıldan beri ilk kez özel GPU pazarına yeniden katıldığını görmekten mutluyuz. (Ve hayır, gerçekten saymıyorum Geçen yıldan Intel DG1yalnızca belirli anakartlarda çalıştığından.)
Arc A380, rakip AMD ve Nvidia GPU’larla nasıl bir araya geliyor ve AV1 donanım kodlama hızlandırma konusundaki tüm hype nedir? Bizim içinde nereye düştüğünü görebilirsiniz. GPU kıyaslama hiyerarşisi, eğer istersen spoiler… iyi değil. Ama gelelim detaylara.
Arc Alchemist Mimarlık Özeti
Kapsamlı bir kapsam sağladık Intel’in Arc Alchemist mimarisi, yaklaşık bir yıl öncesine kadar uzanıyor. Bu parçayı ilk yazdığımızda, 2021’in sonlarında veya 2022’nin başlarında bir lansman bekliyorduk. Bu, planlanan Mart 2022 lansmanına, ardından sonunda 2022 ortalarında bir sürüme dönüştü – ve en azından henüz tam sürüm bile değil. Arc A380, fiyat ve performans merdiveninin en altındaki yalnızca ilk salvodur. birçok ipucunu gördük. daha hızlı Arc A750yakın gibi görünen RTX 3060 performans, Intel’in kendi kıyaslamalarına dayalıdır ve bu, önümüzdeki ay ya da öylesine içinde piyasaya sürülmelidir. Daha hızlı olan Arc A770 veya orta seviye Arc A580 ve diğer ürünler ne olacak? Sadece zaman gösterecek.
Arc Alchemist, Intel’in önceki grafik tasarımlarından bir farklılığı temsil ediyor. Bazı öğelerde muhtemelen çok fazla örtüşme vardır, ancak Intel bazı temel yapı taşlarının adlarını değiştirmiştir. Artık Vektör Motorları (VE’ler) olarak adlandırılan “Yürütme Birimleri (EU’ler)” geride kaldı. Her VE, döngü başına sekiz FP32 işlemi hesaplayabilir, bu da gevşek bir şekilde “GPU çekirdeklerine” veya GPU gölgelendiricilere çevrilir ve kabaca AMD ve Nvidia gölgelendiricilerine eşdeğerdir.
Intel, 16 VE’yi diğer işlevleri de içeren tek bir Xe-Core’da gruplandırır. Böylece her Xe-Core 128 gölgelendirici çekirdeğe sahiptir ve kabaca bir AMD Hesaplama Birimi (CU) veya Nvidia Streaming Multiprocessor (SM) ile eşdeğer olarak çevrilir. Temelde hepsi SIMD (tek komutlu çoklu veri) tasarımlarıdır ve rekabette olduğu gibi Arc Alchemist, gölgelendiricileri DirectX 12 Ultimate özellik setinin tamamını karşılayacak şekilde geliştirdi.
Bu, doğal olarak, tasarıma dahil edilmiş ışın izleme donanımına sahip olmak anlamına gelir ve Intel, Xe-Core başına bir Işın İzleme Birimi’ne (RTU) sahiptir. Işın izleme donanımının kesin ayrıntıları henüz tam olarak net değil, ancak her Intel RTU’nun test edilmesine dayalı olarak, bir Nvidia Ampere RT çekirdeğiyle iyi bir şekilde eşleşebilir.
Intel bununla da kalmadı. VE’ler, RTU’lar ve diğer tipik grafik donanımının yanı sıra Intel, XMX Motorları (Xe Matrix eXtensions) olarak adlandırdığı Matrix Motorlarını da ekledi. Bunlar prensipte Nvidia’nın Tensor çekirdeklerine benzer ve makine öğrenimi ve diğer kullanımlar için çok sayıda daha az kesin veriyi ezmek üzere tasarlanmıştır. Bir XMX Motoru 1024 bit genişliğindedir ve döngü başına 64 FP16 işlemi veya 128 INT8 işlemi işleyebilir, bu da Arc GPU’lara nispeten büyük miktarda hesaplama gücü sağlar.
Intel Arc A380 Teknik Özellikleri
Aradaki mimariye bu kısa genel bakışla birlikte, Arc A380’in birkaç rakip AMD ve Nvidia GPU’ya kıyasla teknik özellikleri burada. Burada teorik performans sağlarken, tüm teraflopların ve teraopların eşit yaratılmadığını unutmayın. Mimarinin ne tür gerçek performans sunabileceğini görmek için gerçek dünya testlerine ihtiyacımız var.
Grafik kartı | Ark A380 | RX 6500XT | RX6400 | GTX 1650 Süper | GTX 1650 |
---|---|---|---|---|---|
Mimari | ACM-G11 | Navi 24 | Navi 24 | TU116 | TU117 |
İşlem teknolojisi | TSMC N6 | TSMC N6 | TSMC N6 | TSMC 12FFN | TSMC 12FFN |
Transistörler (Milyar) | 7.2 | 5.4 | 5.4 | 6.6 | 4.7 |
Kalıp boyutu (mm^2) | 157 | 107 | 107 | 284 | 200 |
SM’ler / CU’lar / Xe-Cores | 8 | 16 | 12 | 20 | 14 |
GPU Çekirdekleri (Shader) | 1024 | 1024 | 768 | 1280 | 896 |
Tensör Çekirdekleri | 128 | – | – | – | – |
Işın İzleme ‘Çekirdekleri’ | 8 | 16 | 12 | – | – |
Temel Saat (MHz) | 2000 | 2310 | 1923 | 1530 | 1485 |
Hızlandırma Saati (MHz) | 2450 | 2815 | 2321 | 1725 | 1665 |
VRAM Hızı (Gbps) | 15.5 | 18 | 16 | 12 | 8 |
VRAM (GB) | 6 | 4 | 4 | 4 | 4 |
VRAM Veri Yolu Genişliği | 96 | 64 | 64 | 128 | 128 |
ROP’lar | 32 | 32 | 32 | 48 | 32 |
TMU’lar | 64 | 64 | 48 | 80 | 56 |
TFLOPS FP32 (Yükseltme) | 5 | 5.8 | 3.6 | 4.4 | 3 |
TFLOPS FP16 (Varsa MXM/Tensor) | 40 | 11.6 | 7.2 | 8.8 | 6 |
Bant genişliği (GBps) | 186 | 144 | 128 | 192 | 128 |
Video Kodlama | H.264, H.265, AV1, VP9 | – | – | H.264, H.265 (Turing) | H.264, H.265 (Volta) |
TDP (watt) | 75 | 107 | 53 | 100 | 75 |
Lansman tarihi | Haziran 2022 | Ocak 2022 | Ocak 2022 | Kasım 2019 | Nisan 2019 |
Lansman Fiyatı | 139 $ | 199 $ | $159 | $159 | 149 $ |
Kağıt üzerinde, Intel’in Arc A380’i temelde AMD’nin RX 6500 XT’si ve RX6400veya Nvidia’nın GTX 1650 Super’i ve GTX 1650. Özellikle kabaca benzer özelliklere sahip yeni kartların mevcut çevrimiçi fiyatlarına bakıldığında, rakiplerinden biraz daha düşük fiyatlı. Bununla birlikte, dikkat edilmesi gereken bazı önemli nitelikler vardır.
Nvidia, RTX 3050’nin (veya RTX 2060’ın) altında ışın izleme donanımına sahip değildir. Benzer şekilde, bu segmentteki AMD veya Nvidia GPU’ların hiçbiri tensör donanımını desteklemez, bu da Intel’e derin öğrenme ve AI uygulamalarında potansiyel bir avantaj sağlar. gerçi bu tamamen elmadan elmaya değil.
Intel, şu anda AV1 ve VP9 donanım hızlandırmalı video kodlamaya sahip tek GPU şirketidir. AMD ve Nvidia’nın yaklaşmakta olan RDNA 3 ve Ada mimarilerine ve muhtemelen VP9’a AV1 desteği eklemesini bekliyoruz, ancak bunun nasıl olacağına dair resmi bir onayımız yok. Bu incelemede daha sonra kodlama performansına ve kalitesine de bakacağız, ancak GTX 1650’nin Nvidia’nın daha yeni Turing (ve Ampere) sürümünden daha düşük kaliteli çıktı sağlayan eski NVENC donanımını kullandığını unutmayın.
Arc A380, 5.0 teraflop’luk teorik hesaplama performansına sahiptir, bu da onu RX 6500 XT’nin biraz gerisinde ancak diğer her şeyin önüne koyar. Ayrıca, bu fiyat sınıfında 6 GB GDDR6 bellek ve 96 bit bellek arabirimiyle birlikte gönderilen tek GPU’dur. Bu, A380’e AMD’den daha fazla bellek bant genişliği, ancak Sonsuz Önbellek olmadan ve Nvidia’nın GPU’larından daha az bellek bant genişliği sağlar. Güç kullanımı 75W hedefliyor, ancak hız aşırtmalı kartlar, AMD ve Nvidia GPU’larda olduğu gibi bunu aşabilir.
Işın izleme yeteneklerini tespit etmek daha zordur. Hızlı bir şekilde özetlemek gerekirse, RTX 20 serisi GPU’lardaki Nvidia’nın Turing mimarisi, tam donanım ışın izleme yeteneklerine sahipti ve her RT çekirdeği, döngü başına bir ışın/üçgen kesişim hesaplaması yapabilir, ayrıca BVH (sınırlayıcı hacim hiyerarşisi) geçişi için donanım desteği vardır. Nvidia, bildiğim kadarıyla belirli bir sayı sağlamadığından, RT çekirdeklerinin döngü başına kaç ışın/kutu BVH kesişimini yönettiği açık değil.
Nvidia’nın Ampere mimarisi, RT çekirdeklerine ikinci bir ışın/üçgen kesişim birimi ekleyerek verimi potansiyel olarak ikiye katladı. (Çoğu durumda Turing BVH donanımının ışın/üçgen donanımından “daha hızlı” olduğu görülüyor, bu nedenle Ampere üçgen hızını iyileştirmeye odaklandı.) Pratikte Nvidia, Ampere’nin RT çekirdeklerinin Turing’in RT çekirdeklerinden tipik olarak %75 daha hızlı olduğunu söylüyor. Amper her zaman tüm ışın/üçgen yürütme yuvalarını dolduramaz.
AMD’nin RDNA 2 mimarisi işleri biraz farklı şekilde ele alıyor. Temelde Turing gibi, her Işın Hızlandırıcıda döngü başına bir ışın/üçgen kesişim hesaplaması yapabilir. Ancak, BVH geçişi için döngü başına dört ışın/kutu kesişimi oranında GPU gölgelendiricileri (teknik olarak doku birimleri) kullanır. RDNA 2’deki doku birimlerinin sayısı göz önüne alındığında, bu oran teoride çok kötü değil, ancak BVH çalışması diğer gölgelendirici ve doku çalışmalarıyla çelişiyor. Sonuç olarak, AMD’nin mevcut Işın Hızlandırıcılarını Nvidia’nın RT çekirdeklerinden daha yavaş ve daha az verimli ve belki de (gerçek dünya performansına bakılırsa) daha fazla bellek yoğun hale getirir.
Intel’in RTU’ları, donanımda hem ışın/kutu kesişimlerini hem de ışın/üçgen kesişimlerini yapabilmeleri açısından Nvidia’nın RT çekirdeklerine benzer. Yukarıdaki video, her şeyi daha ayrıntılı olarak açıklar, ancak ham verim, RTU başına döngü başına 12’ye kadar ışın/kutu BVH kesişimi ve döngü başına bir ışın/üçgen kesişimidir. Intel ayrıca isabet oranlarını ve performansı iyileştirmek için özel bir BVH önbelleğine ve Xe-Cores için gölgeleme iş yüklerini daha iyi eşleştirmek için RTU’lardan gelen çıktıyı optimize eden bir İş Parçacığı Sıralama Birimine sahiptir.
Intel, aşağı yukarı RTU’ların Nvidia’nın Ampere RT çekirdeklerinden daha yetenekli olduğunu iddia ediyor, bu da RTU’ların Turing ve RDNA 2’den daha iyi olduğu anlamına geliyor. Bu noktayı kanıtlamak için Intel, Arc A770’i RTX 3060 ile karşı karşıya getirerek 17 oyunda ışın izleme performansı gösterdi.
Genel olarak Intel, A770’te RTX 3060’tan yaklaşık %12 daha hızlı bir ışın izleme performansı gösteriyor. Elbette bu A380 değil ve henüz saf ışın izleme yapmadığımız için oyun performansını etkileyen birçok başka faktör var. A770, ayrıca RTX 3060’ın 30 RT çekirdeğine kıyasla 32 RTU’ya sahiptir. Yine de, Intel’in RTU’ları kağıt üzerinde oldukça iyi görünüyor.
Mesele şu ki, sadece sekiz RTU ile A380 kesinlikle bir ışın izleme santrali olmayacak – örneğin Nvidia’nın RTX serisinde 20 veya daha fazla RT çekirdeği var veya listeye mobil RTX 3050’yi eklerseniz 16, Nvidia’nın en yavaşı RTX çipi. Öte yandan AMD’nin RX 6000 serisi parçalarında 12 kadar az Ray Hızlandırıcısı var ve Steam Deck gibi entegre RDNA 2 uygulamalarının sekiz kadar az RA’sı olabilir, ancak RT performansı anlaşılır bir şekilde oldukça fazla acı çekiyor – ihtiyacınız değil ışın izleme, donanımın işlevselliği desteklemesinden dört yıl sonra bile.