İçerik üretmedeki etkileyici yeteneklerine rağmen, büyük dil modelleri (LLM’ler) donanım tasarlamakta pek iyi değillerdir. Bu zayıflığın, modelleri eğitmek için donanım tasarım verilerinin eksikliğinden kaynaklandığına inanan Nvidia, Georgia Teknoloji Enstitüsü ve diğerleri, ihtiyaç duyulan açık kaynaklı genel veri setini oluşturmaya yardımcı olmak için bir yarışma düzenlediler.
Nvidia’nın tasarım otomasyonu araştırmaları direktörü Haoxing (Mark) Ren, yakın zamanda X (eski adıyla Twitter) üzerinde iş birliğini duyurdu. Ren, donanım tasarımına özgü yüksek kaliteli veri eksikliğinin “LLM Destekli Donanım Tasarımı için darboğazlardan biri” olduğunu söyledi. Bu eksiklikleri gidermek için Nvidia ve diğerleri LLM Destekli Donanım Kod Üretimi üzerine ICCAD Yarışması düzenledi.
LLM yardımıyla GPU’lar ve diğer donanımları tasarlamak için mevcut çabalar “kapsamlı insan etkileşimi” gerektirir. LLM’ler tarafından oluşturulan tasarımlar genellikle sentezlenemez veya işlevsel değildir veya çok basit veya pratik değildir. Araştırmacılar bunun ön eğitim sırasında yüksek kaliteli donanım tasarım verilerine yeterince maruz kalınmaması nedeniyle olduğuna inanıyor.
Yüksek kaliteli veri eksikliği, genellikle LLM Destekli Donanım Tasarımı için darboğazlardan biri olarak kabul edilir. Açık kaynaklı, büyük ölçekli, yüksek kaliteli bir veri seti geliştirmek için @ICCAD’de EIC Lab @GaTech ile birlikte LLM4HWDesign yarışmasını düzenliyoruz. https://t.co/qvwLZUlOVh8 Temmuz 2024
Nvidia’nın bir projesinin şirket içi büyük ölçekli bir Verilog kod veri kümesini kullanarak elde ettiği başarıyı fark ettikten sonra, organizatörler mevcut Verilog kod veri kümesini zenginleştirmeye karar verdiler. Yarışma, sonunda açık kaynaklı olacak büyük ölçekli, yüksek kaliteli bir donanım tasarım kodu veri kümesi oluşturmayı amaçlıyor.
LLM4HWDesign yarışması iki aşamada yürütülür. İlk aşama olan veri örneği toplama, 10 Ağustos 2024’te sona erer. 20 Ağustos’tan 1 Ekim’e kadar, ikinci aşama Aşama I’de toplanan veri kümelerini iyileştirecek ve ince ayar yapacaktır. Aşama I’de veri kümeleri toplanırken, yarışma katılımcıları mevcut Verilog veri kümesiyle başlayacak ve onu genişletecektir.
Aşama II’de katılımcılar düşük kaliteli verileri kaldırmak için veri filtrelemeyi kullanacak ve toplanan veri örnekleri için otomatik olarak daha doğru açıklamalar üretmek için teknikler geliştirecekler. Son olarak, LLM’ler için öğrenme sürecine yardımcı olmak için etiketleme stratejileri oluşturacaklar.
LLM4HWDesign yarışmasının kazananları, Ekim 2024 sonunda IEEE/ACM’nin Bilgisayar Destekli Tasarım Uluslararası Konferansı’nda duyurulacaktır. Nvidia ve Ulusal Bilim Vakfı, yarışmanın sağladığı tanınırlığın yanı sıra bazı değerli ödüller de içeren yarışmaya sponsor olmaktadır: