Bir bakıma açık kaynak ve yapay zeka birlikte doğmuştur.
1971’de çoğu insana yapay zekadan bahsetmiş olsaydınız, şunu düşünebilirlerdi: Isaac Asimov’un üç robot yasası. Ancak yapay zeka o yıl MIT’de zaten gerçek bir konuydu. Richard M. Stallman (RMS) katıldı MIT yapay zeka laboratuvarı. Yıllar sonra, özel mülk yazılım ortaya çıktıkça RMS, açık kaynaklı yazılım şeklindeki radikal fikri geliştirdi. Onlarca yıl sonra özgür yazılıma dönüşen bu kavram, modern yapay zekanın doğum yeri haline gelecekti.
O bir bilim kurgu yazarı değil, bilgisayar bilimcisidir. Alan TuringModern yapay zeka hareketini başlatan. Turing’in 1950’de yayınlanan makalesi Bilgisayar Makinesi ve Zeka Turing testinin kökenidir. Özetle bu test, eğer bir makine sizi bir insanla konuştuğuna inandırabiliyorsa, o makinenin akıllı olduğunu belirtir.
Neden GNU-ChatGPT’miz yoktu?
Bazılarına göre, günümüzün yapay zekaları bunu zaten yapabiliyor. Katılmıyorum ama açıkça doğru yoldayız.
1960 yılında bilgisayar bilimcisi John McCarthy “Yapay zeka” terimini icat etti ve bu süreçte Lisp dili. Bilgisayar bilimcisine göre Paul GrahamMcCarthy Öklid’in geometri için yaptıklarını programlamak için başarıldı. Bir avuç basit operatör ve işlevler için bir gösterimden tam bir programlama dili oluşturmanın nasıl mümkün olduğunu gösterdi.
Veri ve kodun karıştırıldığı Lisp, ilk yapay zeka dili oldu. Bu aynı zamanda RMS’nin programlamaya olan ilk aşkıdır.
Peki 1980’lerde neden GNU-ChatGPT’miz yoktu?
ChatGPT ve Llama 2 açık kaynaklardan doğmuştur
Birçok teori var. Benim favorim, ilk yapay zekaların yanlış on yılda doğru fikirlere sahip olmaları. Ekipman bu zorluğa uygun değildi. Büyük Veri gibi diğer temel unsurlar, gerçek yapay zekanın ayağa kalkmasına yardımcı olacak şekilde henüz mevcut değildi. Hadoop, Spark ve Cassandra gibi açık kaynaklı projeler, makine kümelerinde büyük miktarlarda veriyi depolamak ve işlemek için gereken yapay zeka ve makine öğrenimi araçlarını sağladı. Bu veriler ve bunlara hızlı erişim olmadan, büyük dil modelleri (LLM’ler) çalışamazdı.
Bugün, açık kaynak hayranı olmayan Bill Gates bile, açık kaynak tabanlı yapay zekanın dünyanın en büyük yapay zekası olduğunu kabul ediyor. Grafiksel kullanıcı arayüzü (GUI) fikrinin keşfedilmesinden bu yana en büyük yenilik Bu GUI fikrinden Gates’in Windows adında küçük bir program yarattığını hatırlayabilirsiniz.
Özellikle ChatGPT ve Llama 2 gibi günümüzün son derece popüler üretken yapay zeka modelleri açık kaynaklardan doğmuştur. Bu, ChatGPT, Llama 2 veya DALL-E’nin ücretsiz yazılım olduğu anlamına gelmez. Durum bu değil.
TensorFlow ve PyTorch ChatGPT’yi güçlendiriyor
Ah, öyle olmaları gerekiyordu. OpenAI’nin ilk yatırımcılarından Elon Musk’un söylediği gibi: “OpenAI açık kaynak olarak oluşturuldu (bu yüzden ona “Açık” AI adını verdim), Google’a karşı ağırlık görevi görecek, kar amacı gütmeyen bir şirket. Ancak artık Microsoft tarafından kontrol edilen, tescilli, maksimum kâr sağlayan bir şirket haline geldi. Bu hiç de planladığım bir şey değildi.”
Ne olursa olsun, OpenAI ve diğer tüm üretken yapay zeka programları açık kaynak temelleri üzerine inşa edilmiştir. Özellikle, Sarılma Yüz Dönüşümü makine öğrenimi modelleri oluşturmak için en iyi açık kaynaklı kütüphanedir. Doğal dil işleme görevleri için önceden eğitilmiş modeller, mimariler ve araçlar sağlar. Bu, geliştiricilerin mevcut kalıpları geliştirmelerine ve bunları belirli kullanım durumları için hassaslaştırmalarına olanak tanır. ChatGPT, Yüksek Lisans dereceleri için Hugging Face kütüphanesine güveniyor. Transformer olmadan ChatGPT olmaz.
Ayrıca sırasıyla Google ve Facebook tarafından geliştirilen TensorFlow ve PyTorch da ChatGPT’yi destekliyordu. Bu Python çerçeveleri, derin öğrenme modellerini oluşturmak ve eğitmek için gerekli araçları ve kitaplıkları sağlar. Diğer açık kaynaklı AI/ML programlarının bu çerçevelerin üzerine kurulduğunu söylemeye gerek yok. Örneğin, üst düzey bir TensorFlow API’si olan Keras, derin öğrenme deneyimi olmayan geliştiriciler tarafından sıklıkla kullanılır. nöral ağlar.
Meta lisans tuzağı
Hangisinin daha iyi olduğu konusunda sonsuza kadar tartışabilirsiniz – ve Yapay zeka programcıları bunu yapıyor – ancak birçok projede hem TensorFlow hem de PyTorch kullanılıyor. En sevdiğiniz AI sohbet robotunun perde arkasında farklı açık kaynaklı projelerin bir karışımı var.
Meta’nın Llama-2’si gibi bazı yüksek profilli programlar özgür yazılım olduklarını iddia ediyor. Durum bu değil. Birçok özgür yazılım programcısı, başlıca yapay zeka programlarından herhangi biri kadar kullanıcı dostu olduğu için Llama’ya yönelmiş olsa da, Llama-2 özgür bir yazılım değildir. Elbette indirip kullanabilirsiniz. Ve Llama tarafından desteklenen uygulamalar oluşturmak kolaydır. Lisansta gömülü olan tek bir küçük sorun var: Programınız son derece başarılıysa ve
Önceki ay 700 milyondan fazla aylık aktif kullanıcıya sahipseniz, Meta’dan, Meta’nın tamamen kendi takdirine bağlı olarak size verebileceği bir lisans talep etmelisiniz.
Yani Lama’ya dayalı bir Sanal Kız/Erkek Arkadaş geliştirerek milyarder olma hayallerinden vazgeçebilirsiniz. Mark Zuckerberg, fazladan birkaç milyar euro kazanmasına yardımcı olduğunuz için size teşekkür edebilir.
Google mühendisinden çarpıcı sızıntı
Ancak bazı gerçek açık kaynaklı yüksek lisanslar da var — örneğin Şahin180B.
Ancak neredeyse tüm büyük ticari Yüksek Lisanslar gerçek anlamda açık kaynak değildir. Kesinlikle, Dikkatli olun, tüm ana LLM’ler açık veriler üzerine eğitildi. Örneğin, GPT-4 ve diğer büyük LLM’lerin çoğu, verilerinin bir kısmını Ortak Tarama, web’den alınan petabaytlarca veriyi içeren bir metin arşivi. Halka açık bir siteye bir şey yazdıysanız (Facebook’ta mutlu bir doğum günü mesajı, Reddit’te bir yorum, Wikipedia’da bir söz veya Archives.org’da bir kitap) ve bu metin HTML ile yazılmışsa, büyük olasılıkla veriler orada olacak.
Peki açık kaynak, yapay zekanın iyi kızı olmaya devam etmeye mahkum mu? Çok hızlı değil.
Sızan bir dahili Google belgesinde, bir Google AI mühendisi şunu yazdı: “Rahatsız edici gerçek şu ki, üretken yapay zeka silahlanma yarışını da kazanacak durumda değiliz. Biz tartışırken, üçüncü bir grup sessizce öğle yemeğimizi yiyordu.”
Bu üçüncü aktör mü? Burası özgür yazılım topluluğudur.
Yapay zeka yalnızca bulutta çalışmıyor
Üretken yapay zeka ile faydalı yanıtlar almak için bulut bilişim devlerine veya binlerce üst düzey GPU’ya ihtiyacınız olmadığı ortaya çıktı. Aslında, Yüksek Lisans’ı akıllı telefonunuzdan çalıştırabilirsiniz: Modelleri Pixel 6’da çalıştıran kişiler sahip olmak Saniyede 5 LLM jetonu. Ayrıca kişiselleştirilmiş yapay zekaya ince ayar yapma bir akşam dizüstü bilgisayarınızda. Mühendis, “bir dil modelini tüketici donanımında birkaç saat içinde özelleştirebildiğinizde” bunun “önemli olduğunu” belirtiyor.
Ücretsiz yazılım Hugging Face ile düşük dereceli adaptasyon (LoRA)diğer yöntemlerin maliyetinden ve zamanından çok daha düşük bir maliyetle modelde ince ayar yapabilirsiniz. Hangi kesir? Tüketici donanımında bir dil modelini birkaç saat içinde özelleştirmeye ne dersiniz?
Google geliştiricisi şunu ekliyor:
“LoRA’yı bu kadar etkili kılan şeylerden biri de diğer ayarlama biçimleri gibi istiflenebilir olmasıdır. Talimat ayarlama gibi geliştirmeler uygulanabilir ve daha sonra diğer katkıda bulunanlar diyaloglar, mantık yürütme veya araç kullanımı ekledikçe bundan faydalanılabilir. Bireysel ayarlamalar küçük olsa da, “toplamlarının küçük olması şart değil. Bu, model güncellemelerinin zaman içinde birikmesine olanak tanır. Bu şu anlama gelir: Yeni ve daha iyi veri kümeleri ve görevler mevcut oldukça, model tam çalıştırma maliyetini ödemeye gerek kalmadan ucuz bir şekilde güncellenebilir.”
“Açık kaynakla doğrudan rekabet, kaybedilen bir tekliftir”
Gizemli programcımız şu sonuca vardı: “Açık kaynakla doğrudan rekabet, kaybedilen bir teklif…. Yetişmeyi beklememeliyiz. Bu boşuna değil modern internet özgür yazılımla çalışır. Açık kaynağın taklit edemeyeceğimiz önemli faydaları var.”
Otuz yıl önce hiç kimse açık kaynaklı bir işletim sisteminin bir gün Unix ve Windows gibi özel sistemlerin yerini alabileceğini hayal edemiyordu. Gerçekten açık ve kapsamlı bir yapay zeka programının bugün kullandığımız yarı özel programların yerini alması otuz yıldan çok daha az zaman alabilir.
Kaynak : “ZDNet.com”