
Eğitimde kullanılan donanım kaynakları dikkat çekicidir. Modern modeller, makine öğrenme işlemlerini (“makine öğrenimi”) geleneksel yongalardan daha verimli bir şekilde gerçekleştirebilen, yongalar olarak bilinen özel çipler kullanır. Bu yongalar paralel olarak birçok işlem geliştirebilir ve bu nedenle modelleri eğitmek için gereken süreyi hızlandırabilir.
Openii American Company’nin mevcut chatgpt’in tabanındaki model olan GPT-4’ü alalım. Son zamanlarda bazılarına göre, eğitimi yaklaşık 160 Amerikan ailesinin yıllık enerji tüketimine eşdeğerdir; Önceki modelden üçte biri (GPT-3). Eğitim maliyetinin, kullanılan yongalar ve enerji ve üzerinde çalışan mühendislerin ücretleri için on milyonlarca dolar (GPT-3’e kıyasla on kat) olduğu tahmin edilmektedir.
Eğitim tamamlandıktan sonra, model metnin oluşturulması için hazırdır. Bir kullanıcı bir girdi (“istem”) sağladığında, model, tutarlı ve eşzamanlı olarak ilgili bir yanıt oluşturmak için eğitim sırasında öğrenilen bilgileri kullanır. Bu süreç, enerji açısından eğitimden nispeten daha ucuzdur; Örneğin, geçen yılki yapılan bir araştırmaya göre, bin kat metin oluşturmak, bir akıllı telefonu tamamen yüklemek için gereken enerjinin sadece% 16’sını tüketiyor.
Bununla birlikte, resim değişiyor: Son aylarda yayınlanan bazı modeller, daha uzun ve daha karmaşık hale getirdikleri için üretimin maliyetini büyük ölçüde artırdı. Bunlar, Openai O1 ve O3 gibi sözde “akıl yürütme” modelleridir. Hemen bir cevap oluşturmak yerine, aslında farklı olası seçenekleri değerlendirirler; Sanki cevap vermeden önce “düşünürler”.
Genel olarak, AI ile metin üretimine yol açan tüm sürecin önemli miktarda enerji ve donanım kaynağı gerektirdiğini belirtmek önemlidir. Önemli bir çevresel etki de kaynaklanmaktadır.

