Yazılım geliştiricisi ve elektronik tablo bağımlısı olduğunu itiraf eden Ishan Anand, GPT-2’yi Microsoft Excel’e sıkıştırdı. Daha da şaşırtıcı olanı, işe yarıyor; büyük dil modellerinin (LLM’ler) nasıl çalıştığına ve temeldeki Transformer mimarisinin akıllı sonraki token tahminini nasıl yaptığına dair fikir sağlıyor. Anand, “Bir e-tabloyu anlayabiliyorsanız, o zaman yapay zekayı da anlayabilirsiniz” diye övünüyor. 1,25 GB’lık e-tablo oluşturuldu GitHub’da mevcut herkesin indirmesi ve oynaması için.

Doğal olarak, GPT-2’nin bu e-tablo uygulaması, 2024’te mevcut olan Yüksek Lisans’ların bir miktar gerisindedir, ancak GPT-2 son teknoloji ürünüydü ve 2019’da birçok manşete konu oldu. GPT-2’nin bir şey olmadığını hatırlamak önemlidir. ‘sohbet’ döneminden önce geldiği gibi sohbet etmek için. ChatGPT, 2022’de GPT-3’ü konuşma yoluyla yönlendirmek için yapılan çalışmalardan elde edildi. Üstelik Anand burada GPT-2 Small modelini kullanıyor ve XLSB Microsoft Excel Binary dosyasında 124 milyon parametre var ve GPT-2’nin tam sürümünde 1,5 milyar parametre kullanılıyor (GPT-3 ise 175 milyara kadar parametreyle çıtayı yükseltti).



genel-21