Yapay zeka derin ve kıvrımlı bir dünyadır. Bu alanda çalışan bilim adamları, üzerinde çalıştıklarını açıklamak için genellikle jargon ve lingo’ya güveniyorlar. Sonuç olarak, bu teknik terimleri yapay zeka endüstrisini kapsamımızda kullanmamız gerekir. Bu nedenle, makalelerimizde kullandığımız en önemli kelimelerin ve cümlelerin tanımlarıyla bir sözlük oluşturmanın yararlı olacağını düşündük.
Araştırmacılar, ortaya çıkan güvenlik risklerini belirlerken yapay zekanın sınırını zorlamak için sürekli olarak yeni yöntemler ortaya çıkardıkça yeni girişler eklemek için bu sözlüğü düzenli olarak güncelleyeceğiz.
Bir AI temsilcisi, sizin adınıza bir dizi görev gerçekleştirmek için AI teknolojilerini kullanan bir aracı ifade eder – daha temel bir AI chatbotunun yapabileceğinin ötesinde – dosyalama masrafları, bir restoranda masa rezervasyonu veya hatta kod yazma ve koruma gibi. Bununla birlikte, daha önce açıkladığımız gibi, bu ortaya çıkan alanda çok sayıda hareketli parça var, bu nedenle farklı insanlar bir AI ajanına atıfta bulunduklarında farklı şeyler ifade edebilirler. Altyapı da öngörülen yetenekleri sunmak için hala inşa edilmektedir. Ancak temel kavram, çok aşamalı görevleri yerine getirmek için birden fazla AI sisteminden yararlanabilecek özerk bir sistem anlamına gelir.
Basit bir soru göz önüne alındığında, bir insan beyni bu konuda çok fazla düşünmeden cevap verebilir – “Hangi hayvan bir zürafa ve bir kedi arasında daha uzundur?” Gibi şeyler? Ancak birçok durumda, genellikle doğru cevabı bulmak için bir kalem ve kağıda ihtiyacınız vardır, çünkü aracı adımlar vardır. Örneğin, bir çiftçinin tavuk ve inekleri varsa ve birlikte 40 kafa ve 120 bacağı varsa, cevabı bulmak için basit bir denklem yazmanız gerekebilir (20 tavuk ve 20 inek).
Yapay zeka bağlamında, büyük dil modelleri için düşünce zinciri akıl yürütme, bir sorunu nihai sonucun kalitesini artırmak için daha küçük, ara adımlara ayırmak anlamına gelir. Genellikle bir cevap almak daha uzun sürer, ancak cevabın özellikle bir mantık veya kodlama bağlamında doğru olma olasılığı daha yüksektir. Akıl yürütme modelleri, geleneksel büyük dil modellerinden geliştirilmiştir ve takviye öğrenimi sayesinde düşünce zinciri düşünme için optimize edilmiştir.
(Görmek: Büyük dil modeli)
AI algoritmalarının çok katmanlı, yapay sinir ağı (YSA) yapısı ile tasarlandığı kendi kendini geliştiren makine öğreniminin bir alt kümesi. Bu, doğrusal modeller veya karar ağaçları gibi daha basit makine öğrenimi tabanlı sistemlere kıyasla daha karmaşık korelasyonlar yapmalarını sağlar. Derin öğrenme algoritmalarının yapısı, insan beynindeki nöronların birbirine bağlı yollarından ilham alır.
Derin öğrenme AI’leri, insan mühendislerinin bu özellikleri tanımlamasını istemek yerine verilerdeki önemli özellikleri kendileri tanımlayabilir. Yapı ayrıca hatalardan öğrenebilen ve tekrarlama ve ayarlama süreci yoluyla kendi çıktılarını iyileştirebilen algoritmaları da destekler. Bununla birlikte, derin öğrenme sistemleri iyi sonuçlar elde etmek için çok fazla veri noktası gerektirir (milyonlarca veya daha fazla). Ayrıca derin öğrenmeyi ve daha basit makine öğrenme algoritmalarını eğitmek genellikle daha uzun sürer – bu nedenle geliştirme maliyetleri daha yüksek olma eğilimindedir.
(Görmek: Sinir ağı)
Bu, performansı daha önce eğitiminin odak noktasından daha spesifik bir görev veya alan için optimize etmeyi amaçlayan bir AI modelinin daha fazla eğitimi anlamına gelir-tipik olarak yeni, uzmanlaşmış (yani görev odaklı) verilerle beslenerek.
Birçok AI girişim, ticari bir ürün oluşturmak için bir başlangıç noktası olarak büyük dil modellerini alıyor, ancak önceki eğitim döngülerini kendi alana özgü bilgi ve uzmanlıklarına dayalı olarak ince ayar ile destekleyerek bir hedef sektör veya görev için yardımcı programı yükseltmek için yarışıyor.
(Görmek: Büyük Dil Modeli (LLM))
Büyük dil modelleri veya LLM’ler, ChatGPT, Claude, Google’ın İkizleri, Meta’nın AI lama, Microsoft Copilot veya Mistral’s Le Chat gibi popüler AI asistanları tarafından kullanılan AI modelleridir. Bir AI asistanı ile sohbet ettiğinizde, isteğinizi doğrudan veya web tarama veya kod tercümanları gibi farklı mevcut araçların yardımıyla işleyen büyük bir dil modeliyle etkileşime girersiniz.
AI asistanları ve LLM’lerin farklı isimleri olabilir. Örneğin, GPT Openai’nin büyük dil modelidir ve ChatGPT AI Asistan Ürünüdür.
LLM’ler milyarlarca sayısal parametreden oluşan derin sinir ağlarıdır (veya ağırlıklar, aşağıya bakın) kelimeler ve ifadeler arasındaki ilişkileri öğrenen ve bir tür çok boyutlu kelime haritası olan dilin bir temsili yaratan.
Bunlar milyarlarca kitapta, makalede ve transkriptlerde buldukları kalıpları kodlamaktan yaratılmıştır. Bir LLM istediğinizde, model isteğe uyan en olası deseni oluşturur. Daha sonra, daha önce söylenenlere dayanarak sonuncusundan sonra en olası bir sonraki kelimeyi değerlendirir. Tekrarlayın, tekrarlayın ve tekrarlayın.
(Görmek: Sinir ağı)
Sinir ağı, derin öğrenmeyi destekleyen çok katmanlı algoritmik yapıyı-ve daha geniş bir şekilde, büyük dil modellerinin ortaya çıkmasından sonra üretken AI araçlarındaki tüm patlamayı ifade eder.
Veri işleme algoritmaları için bir tasarım yapısı olarak insan beyninin yoğun birbirine bağlı yollarından ilham alma fikri, 1940’lara kadar uzanıyor olsa da, teorinin gücünün kilidini açan video oyunu endüstrisi aracılığıyla – grafik işleme donanımının (GPU) çok daha yeni yükselişiydi. Bu yongalar, daha önceki dönemlerde mümkün olandan çok daha fazla katmanlı antrenman algoritmalarına çok uygun olduğunu kanıtladı-sinir ağı tabanlı AI sistemlerinin ses tanıma, otonom navigasyon veya ilaç keşfi için birçok alanda çok daha iyi performans elde etmesini sağladı.
(Görmek: Büyük Dil Modeli (LLM))
Ağırlıklar, sistemi eğitmek için kullanılan verilerde farklı özelliklere (veya giriş değişkenlerine) ne kadar önem (veya ağırlık) verildiğini belirledikleri için AI eğitimine çekirdektir – böylece AI modelinin çıktısını şekillendirir.
Başka bir deyişle, ağırlıklar, verilen eğitim görevi için bir veri kümesinde en belirgin olanı tanımlayan sayısal parametrelerdir. Girişlere çarpma uygulayarak işlevlerini elde ederler. Model eğitimi tipik olarak rastgele atanan ağırlıklarla başlar, ancak süreç ilerledikçe, model hedefle daha yakından eşleşen bir çıktıya ulaşmaya çalışırken ağırlıklar ayarlanır.
Örneğin, hedef bir konum için tarihi gayrimenkul verileri üzerinde eğitilmiş konut fiyatlarını tahmin etmek için bir AI modeli, bir mülkün müstakil, yarı müstakil, otopark varsa veya yoksa, bir garaj vb.
Nihayetinde, modelin bu girişlerin her birine eklediği ağırlıklar, verilen veri kümesine dayanarak bir özelliğin değerini ne kadar etkilediklerinin bir yansımasıdır.

