Boris Zhitkov/Getty Images
Üretken yapay zekanın (gen AI) büyümesi, Open AI’nin GPT-4o’su, Google’ın Gemini’si ve Anthropic’in Claude’u gibi yüksek profilli büyük dil modelleri (LLM’ler) tarafından yönlendiriliyor.
Ancak bu büyük modeller manşetlere çıkarken, başka bir model türü de zemin kazanıyor. Bazı uzmanlar Küçük Dil Modellerinin (SLM) genel yapay zekanın geleceği olabileceğine inanıyor.
Araştırma firması Gartner’a göre, şimdiye kadar dil modellerinin geliştirilmesinde yüksek lisans eğitimleri baskın olsa da, SLM’ler ana zorluklara çözümler sunuyor Özellikle bütçe kısıtlamaları, veri koruma, gizlilik endişeleri ve yapay zeka ile ilgili risklerin azaltılması söz konusu olduğunda CIO’lar tarafından belirlenir. Bu nedenle iş dünyası liderleri, genel yapay zekayı keşfederken daha büyük ve daha küçük modeller arasında seçim yapmak zorunda kalabilir.
Mücadeleyi ikisinden hangisi kazanacak? Beş yönetici bize görüşlerini bildiriyor.
1. Alana özel fırsatları değerlendirin
L&G’nin veri sorumlusu Claire Thompson, hem küçük hem de büyük modellerin sektörde yer almasını beklediğini söylüyor. Ancak günümüzün en popüler modellerinin yeni kullanım senaryolarına uyarlanabileceğine de inanıyor.
“Bazı Yüksek Lisans’lar, onlardan daha fazlasını elde etmek için belirli konularda eğitim almaya başlayabilir. Ve bunun giderek daha fazla gerçekleşmeye başladığını görüyorum” dedi.
Alana özel modeller elde etmek için hâlâ yapılması gereken çok iş olsa da Thompson, birçok şirketin şirket içi gelişime çok az İK ve mali kaynak ayırdığını söylüyor.
“Şirketlerin kendi modellerini oluşturup oluşturmadıklarını bilmiyorum” diye ekledi. “Model oluşturma hakkında konuştuğumda, daha çok mevcut modellerden dahili olarak yararlanmak ve sonuçları yönlendirmek için verilerinizi güvenli bir ortamda kullanmakla ilgili.”
Ancak Bayan Thompson, ister küçük ister büyük olsun, geleceğin belirli modellerde olduğuna inanıyor. -She, “Bir modeli tıbbi bilgi, iklim ve ESG (çevresel, sosyal ve yönetişim) konularına ve varlık piyasalarına göre uyarlayabilirsiniz” diyor.
2. Doğru atı seçin
MAG Airports Group’un CIO’su Nick Woods, üretken yapay zekanın geleceğinin muhtemelen büyük ve küçük modellerin bir karışımı olacağını açıklıyor. “Bunun herkese uygun tek bir model olduğunu düşünmüyorum” diyor ve ekliyor: “ve seçeceğiniz model, işletmenizdeki kullanım durumuna bağlıdır.”
Woods, profesyonellerden şirketin bir yapay zeka programı uygulaması gerektiğini duyduğunu söylüyor. Cevabı mı? “Hayır, bu yapılacak son şey.”
Woods, liderlerin şirketin dönüşüm gündemine odaklanması ve üretken yapay zeka da dahil olmak üzere hangi araçların doğru sonuçların elde edilmesine yardımcı olabileceğine karar vermesi gerektiğini söylüyor. “Bir uçak ağ geçidinin ne zaman konuşlandırıldığını tespit etmek gibi belirli bir kullanım durumunu çözmek için Edge Computing modunda küçük ve spesifik bir modeli çalıştırabilirim” diyor.
Kısacası Bay Woods, model seçmenin doğru atı seçmek olduğunu söylüyor.
“Özel kullanım durumları için Edge Computing’de birçok küçük modelin geniş ölçekte dağıtıldığını göreceğiz” dedi. “Bu neredeyse kaçınılmaz. Ancak yine de bazı büyük modellerin galip geleceğini düşünüyorum.”
3. Bağlamı göz önünde bulundurun
Gartner analisti Gabriela Vogel, CIO’larla yaptığı görüşmelerin, küçük, alana özgü modellerin en azından kısa vadede önemli bir rol oynayacağını gösterdiğini söylüyor.
“Müşteriler belirli bir bağlama uygulanan modelleri bulmaya ve oluşturmaya çalışıyor” diyor. “Bunlar mutlaka büyük genel modeller değil, belirli bir uygulama için özel olarak küçük veritabanlarına bağlı modellerdir.”
Gabriela Vogel ayrıca giderek daha fazla şirketin SLM kullanarak yapay zeka hizmetlerini kullanarak keşiften üretime geçtiğini söylüyor.
“Birçok kişi SML’yi test etti ve daha büyük modellerde neyin işe yarayıp neyin yaramadığını gördü. Daha spesifik olmaya ve bu yaklaşımı uygulamaya çalışıyorlar.”
4. Halüsinasyonları azaltın
Big Bus Tours Müşteri Memnuniyeti Müdürü Ollie Wildeman, SLM ve LLM arasındaki seçimin kullanım durumuna bağlı olduğunu açıklıyor. Ancak birçok işletme için seçim muhtemelen daha büyük bir çözüm yerine daha küçük bir çözüm olacaktır.
ZDNET’e Big Bus Tours’un yapay zeka destekli sohbet robotları ve biletleme içeren çok kanallı destek yazılımı Freshworks Müşteri Hizmetleri Paketi’ni nasıl kullandığını anlatıyor. Şirket ayrıca Satisfi Labs’ın web sitesine bağlanan ve temel müşteri sorularını yanıtlayan yapay zeka destekli bir sanal asistan kullanıyor.
“Bu yapay zeka teknolojisi yalnızca entegre olduğu şirketlerin verilerini dikkate alıyor” diye belirtiyor. “Şirketin teknolojisi, ChatGPT veya diğer araçlar gibi büyük ölçekli yapay zekalara bağlı değil.”
Bay Wildeman, bu sınırlı yaklaşımın avantajları olduğunu söylüyor. Liderler, sonuçların üretilmesi için verilerinin dikkatli bir şekilde kullanıldığından emin olabilirler. “Bu şekilde verileriniz daha güvende çünkü nereden geldiğini ve hangi süreçlerin kullanıldığını biliyorsunuz” diyor. “Ayrıca, daha az halüsinasyon görüyorsunuz çünkü kullandığınız modelin, yaptığınız aktivite türüne göre tasarlandığını biliyorsunuz.”
Bu sonuçlar Wildeman’ın daha küçük, alana özgü modellerin işletmeler için önemli olacağı sonucuna varmasına yol açtı. “İşletmeler için şablon seçimi daha spesifik olacak, genel kullanıcı için ise her yerde gördüğünüz devasa, ücretsiz şablonlar muhtemelen daha fazla kullanılacak.”
5. İlk elden verilerinize odaklanın
Tripadvisor’da veri ve yapay zeka sorumlusu Rahul Todkar, bir işletme için doğru modelin sadece büyüklükle ilgili olmayabileceğini söylüyor.
Profesyoneller her iki modeli de deneyebilir. Ancak Todkar, ister büyük ister küçük olsun, özel modellerin yapay zekanın geleceği olduğunu söylüyor.
“Nispeten küçük bir model olan ancak belirli görevler söz konusu olduğunda harika sonuçlar veren Mistral 7B örneğini ele alalım” diyor. “Bu nedenle benim için gelecek kişiselleştirilebilir modellerde.”
Rahul Todkar’a göre yapay zeka başarısının anahtarı, modelin verilerinizi güvenli ve verimli bir şekilde kullanmasını sağlamaktır. “Önemli olan eğitim alanının boyutu ya da modelin özellikleri değil. Daha ziyade o modeli alıp ilk elden verilerinizle kendi bağlamınızda uygulamak. İşte o zaman standart modellerin ötesine geçersiniz ve buradan elde edilen içgörüleri kullanabilirsiniz. Verileriniz.”
Kaynak : “ZDNet.com”