ChatGPT’nin lansmanı başladı büyük dil modelleri çağında. OpenAI’nin tekliflerine ek olarak, diğer LLM’ler arasında Google’ın LaMDA LLM ailesi (Bard dahil), BLOOM projesi (Microsoft, Nvidia ve diğer kuruluşlardaki gruplar arasında bir işbirliği), Meta’nın LLaMA’sı ve Anthropic’in Claude’u bulunmaktadır.
Şüphesiz daha fazlası yaratılacaktır. Aslında bir Nisan 2023 Arize araştırması Yanıt verenlerin %53’ünün gelecek yıl veya daha erken bir zamanda yüksek lisans (LLM) kurmayı planladığını buldu. Bunu yapmanın bir yaklaşımı, mevcut bir Yüksek Lisans ile başlayan ve onu belirli bir alana özgü bilgiler konusunda dikkatli bir şekilde yeniden eğiten “dikey” bir Yüksek Lisans eğitimi oluşturmaktır. Bu taktik yaşam bilimleri, ilaç, sigorta, finans ve diğer iş sektörlerinde işe yarayabilir.
Bir LLM’yi dağıtmak, güçlü bir rekabet avantajı sağlayabilir; ancak yalnızca iyi yapıldığında.
Yüksek Lisans’lar halihazırda yanlış bilgileri “halüsinasyona uğratma” eğilimleri gibi haber değeri taşıyan sorunlara yol açmıştır. Bu ciddi bir sorundur ve liderliğin dikkatini bu çıktıları üreten süreçlerle ilgili temel kaygılardan uzaklaştırabilir ki bu da benzer şekilde sorunlu olabilir.
Yüksek Lisans eğitimi ve dağıtımının zorlukları
Yüksek Lisans kullanmanın bir sorunu, onları eğitmek ve çalıştırmak için gereken hesaplama talebinin çok yoğun olması nedeniyle muazzam işletme masraflarıdır (bunlara boşuna büyük dil modelleri denmiyor).
Yüksek Lisans’lar heyecan vericidir ancak bunları geliştirmek ve benimsemek çeşitli fizibilite engellerinin aşılmasını gerektirir.
İlk olarak, modelleri çalıştıracak donanım pahalıdır. Yüksek Lisans öğrencileri için popüler bir seçim olan Nvidia’nın H100 GPU’su, ikincil piyasada çip başına yaklaşık 40.000 dolara satılıyor. Bir kaynak bunun kabaca süreceğini tahmin etti 6.000 çip ChatGPT-3.5’e benzer bir Yüksek Lisans eğitimi vermek. Bu, yalnızca GPU’lar için yaklaşık 240 milyon dolar anlamına geliyor.
Bir diğer önemli masraf da bu çiplere güç sağlamak. Yalnızca bir modelin eğitiminin yaklaşık olarak gerektireceği tahmin edilmektedir. 10 gigawatt-saat (GWh) 1.000 ABD evinin yıllık elektrik kullanımına eşdeğer güç. Model eğitildikten sonra elektrik maliyeti değişecektir ancak fahiş olabilir. Bu kaynak, ChatGPT-3.5’i çalıştırmak için gereken güç tüketiminin günde yaklaşık 1 GWh veya 33.000 hanenin toplam günlük enerji kullanımı olduğunu tahmin ediyor.
Güç tüketimi, LLM’leri taşınabilir cihazlarda çalıştırırken kullanıcı deneyimi için de potansiyel bir tehlike olabilir. Bunun nedeni, bir cihazın yoğun şekilde kullanılmasının pilini çok çabuk tüketebilmesi ve bu durumun tüketicinin benimsemesi önünde önemli bir engel oluşturabilmesidir.