Açık kaynak ve özel mülk yazılım arasındaki mücadele iyi anlaşılmıştır. Ancak onlarca yıldır yazılım çevrelerine nüfuz eden gerilimler, sıcak takipteki tartışmalarla birlikte gelişen yapay zeka alanına da karıştı.

New York Times yakın zamanda Fışkıran bir değerlendirme yayınladı Meta CEO’su Mark Zuckerberg, “açık kaynaklı yapay zeka”yı benimsemesinin kendisini Silikon Vadisi’nde nasıl bir kez daha popüler hale getirdiğine dikkat çekti. Ancak sorun, Meta’nın Llama markalı büyük dil modellerinin gerçekte açık kaynak olmamasıdır.

Yoksa onlar mı?

Çoğu tahmine göre değiller. Ancak “açık kaynaklı yapay zeka” kavramının önümüzdeki yıllarda nasıl daha fazla tartışmaya yol açacağının altını çiziyor. Bu, Açık Kaynak Girişiminin (OSI) icra direktörü liderliğinde ele almaya çalışıyor Stefano Maffulli (yukarıdaki resimde) konferanslar, çalıştaylar, paneller, web seminerleri, raporlar ve daha fazlasını kapsayan küresel bir çabayla iki yıldan fazla bir süredir sorun üzerinde çalışıyor.

Yapay zeka yazılım kodu değil

Resim Kredisi: Westend61 Getty aracılığıyla

OSI, Açık Kaynak Tanımı (OSD) çeyrek yüzyıldan fazla bir süredir “açık kaynak” teriminin yazılıma nasıl uygulanabileceğini veya uygulanması gerektiğini ortaya koyuyor. Bu tanımı karşılayan bir lisans, yasal olarak “açık kaynak” olarak kabul edilebilir; ancak lisans yelpazesi aşırı hoşgörülü ile pek hoşgörüsüz arasında değişmektedir.

Ancak eski lisanslama ve adlandırma kurallarını yazılımdan yapay zekaya aktarmak sorunludur. Joseph Jacksaçık kaynak müjdecisi ve VC firmasının kurucusu OSS Sermayesi“var” diyecek kadar ileri gidiyoraçık kaynaklı yapay zeka diye bir şey yok“açık kaynağın açıkça yazılım kaynak kodu için icat edildiğini” belirtti.

Buna karşılık, yapay zeka dünyasında ağın eğitim süreci sırasında öğrendiği parametreleri veya katsayıları tanımlamak için kullanılan bir terim olan “sinir ağı ağırlıkları” (NNW’ler), yazılımla anlamlı bir şekilde karşılaştırılamaz.

“Nöral net ağırlıklar yazılım kaynak kodu değildir; Jacks, bunlar insanlar tarafından okunamıyor ve hata ayıklanamıyor. “Ayrıca, açık kaynağın temel hakları da NNW’lere uyumlu bir şekilde aktarılmıyor.”

Bu durum Jacks ve OSS Capital’deki meslektaşlara yol açtı. Heather Meeker ile kendi tür tanımlarını ortaya çıkarmak“açık ağırlıklar” kavramı etrafında.

Dolayısıyla, “açık kaynaklı yapay zeka”nın anlamlı bir tanımına bile ulaşmadan önce, oraya ulaşmaya çalışmanın doğasında var olan bazı gerilimleri zaten görebiliyoruz. Tanımladığımız “şeyin” var olduğu konusunda hemfikir olamazsak, bir tanım üzerinde nasıl anlaşabiliriz?

Maffulli de ne olursa olsun aynı fikirde.

TechCrunch’a “Bu doğru,” dedi. “İlk tartışmalarımızdan biri buna açık kaynaklı yapay zeka adını verip vermeyeceğimizdi ama herkes zaten bu terimi kullanıyordu.”

Bu, bugün “Yapay Zeka” olarak adlandırdığımız şeyin olup olmadığı konusunda çok sayıda tartışmanın olduğu daha geniş yapay zeka alanındaki bazı zorlukları yansıtıyor. gerçekten yapay zeka ya da yalnızca geniş veri yığınları arasındaki kalıpları tespit etmeyi öğreten güçlü sistemler. Ancak karşı çıkanlar çoğunlukla “Yapay Zeka” terminolojisinin burada olduğu ve onunla mücadele etmenin bir anlamı olmadığı gerçeğine teslim olmuş durumda.

Lama illüstrasyon
Resim Kredisi: Larysa Amosova Getty aracılığıyla

1998 yılında kurulan OSI, savunuculuk, eğitim ve onun temel varoluş nedeni olan Açık Kaynak Tanımı etrafında çok sayıda açık kaynakla ilgili faaliyet üzerinde çalışan, kar amacı gütmeyen, kamu yararına çalışan bir kuruluştur. Bugün kuruluş, finansman için Amazon, Google, Microsoft, Cisco, Intel, Salesforce ve Meta gibi saygın üyelerin sponsorluklarına güveniyor.

Meta’nın OSI’ye katılımı şu anda özellikle dikkate değer çünkü bu konu “açık kaynaklı yapay zeka” kavramıyla ilgili. Meta’nın yapay zeka şapkasını takmasına rağmen açık kaynak sabitlemesindeşirketin Llama modellerinin nasıl kullanılabileceği konusunda dikkate değer kısıtlamaları var: Elbette, araştırma ve ticari kullanım durumları için ücretsiz olarak kullanılabilirler, ancak aylık 700 milyondan fazla kullanıcısı olan uygulama geliştiricilerinin Meta’dan özel bir lisans talep etmesi gerekir. tamamen kendi takdirine bağlı olarak verecektir.

Basitçe söylemek gerekirse, Meta’nın Büyük Teknoloji kardeşleri isterlerse ıslık çalabilirler.

Meta’nın LLM’leri etrafındaki dili bir şekilde şekillendirilebilir. Şirket kendisini aramışken Lama 2 modeli açık kaynakNisan ayında Lama 3’ün gelişiyle terminolojiden biraz uzaklaştı, İfadeler kullanmak bunun yerine “açık olarak erişilebilir” ve “açık olarak erişilebilir” gibi. Ama bazı yerlerde bu hala atıfta bulunuyor model “açık kaynak”tır.

Maffulli, “Sohbette yer alan herkes, Lama’nın kendisinin açık kaynak olarak kabul edilemeyeceği konusunda tamamen hemfikir” dedi. “Meta’da çalışan ve konuştuğum insanlar bunun biraz zor olduğunu biliyorlar.”

Üstelik bazıları burada bir çıkar çatışması olduğunu iddia edebilir: Açık kaynak markalamasından yararlanma arzusu gösteren bir şirket aynı zamanda “tanım”ın yöneticilerine de finansman sağlıyor mu?

OSI’nin yakın zamanda fonunu çeşitlendirmeye çalışmasının nedenlerinden biri de budur. Sloan VakfıAçık Kaynak Yapay Zeka Tanımına ulaşmak için çok paydaşlı küresel girişimin finansmanına yardımcı oluyor. TechCrunch, bu hibenin yaklaşık 250.000 ABD doları tutarında olduğunu açıklayabilir ve Maffulli, bunun kurumsal finansmana olan bağımlılığı etrafındaki bakış açısını değiştirebileceğinden umutlu.

Maffulli, “Sloan bağışının daha da netleştirdiği şeylerden biri de bu: Meta’nın parasına her an elveda diyebiliriz” dedi. “Bunu Sloan Grant’ten önce de yapabilirdik çünkü başkalarından bağış alacağımızı biliyorum. Ve Meta bunu çok iyi biliyor. Bunların hiçbirine müdahale etmiyorlar [process]Microsoft, GitHub, Amazon veya Google da öyle; kesinlikle müdahale edemeyeceklerini biliyorlar çünkü organizasyonun yapısı buna izin vermiyor.”

Açık kaynak yapay zekanın çalışma tanımı

Bir tanım bulmayı tasvir eden konsept illüstrasyon
Resim Kredisi: Aleksey Morozov / Getty Images

Mevcut Açık Kaynak Yapay Zeka Tanımı taslağı şu adreste bulunmaktadır: sürüm 0.0.8üç temel bölümden oluşur: belgenin kapsamını belirleyen “giriş”; Açık Kaynak Yapay Zeka Tanımının kendisi; ve açık kaynak uyumlu bir yapay zeka sistemi için gereken bileşenlerin üzerinden geçen bir kontrol listesi.

Mevcut taslağa göre, Açık Kaynak Yapay Zeka sistemi, sistemi herhangi bir amaç için izin almadan kullanma özgürlüğü vermelidir; başkalarının sistemin nasıl çalıştığını incelemesine ve bileşenlerini incelemesine izin vermek; ve herhangi bir amaçla sistemi değiştirmek ve paylaşmak.

Ancak en büyük zorluklardan biri verilerle ilgiliydi; yani, şirket eğitim veri setini başkalarının incelemesine sunmadıysa bir yapay zeka sistemi “açık kaynak” olarak sınıflandırılabilir mi? Maffulli’ye göre verilerin nereden geldiğini ve geliştiricinin verileri nasıl etiketlediğini, tekilleştirdiğini ve filtrelediğini bilmek daha önemli. Ayrıca, veri kümesini çeşitli kaynaklardan bir araya getirmek için kullanılan koda erişime sahip olmak.

Maffulli, “Bu bilgiyi bilmek, geri kalanı olmadan sade bir veri kümesine sahip olmaktan çok daha iyidir” dedi.

Veri setinin tamamına erişim güzel olsa da (OSI bunu “isteğe bağlı” bir bileşen haline getiriyor), Maffulli bunun birçok durumda mümkün veya pratik olmadığını söylüyor. Bunun nedeni, veri kümesinde geliştiricinin yeniden dağıtma iznine sahip olmadığı gizli veya telif hakkıyla korunan bilgilerin bulunması olabilir. Dahası, birleşik öğrenme, diferansiyel gizlilik ve homomorfik şifreleme gibi teknikler kullanılarak, verinin aslında sistemle paylaşılmadığı makine öğrenimi modellerini eğitmeye yönelik teknikler vardır.

Bu da “açık kaynak yazılım” ile “açık kaynak yapay zeka” arasındaki temel farkları mükemmel bir şekilde vurguluyor: Amaçlar benzer olabilir, ancak benzerleri karşılaştırılabilir değildir ve OSI’nin kendi raporunda yakalamaya çalıştığı şey de bu eşitsizliktir. tanım.

Yazılımda, kaynak kodu ve ikili kod aynı yapının iki görünümüdür: Aynı programı farklı biçimlerde yansıtırlar. Ancak veri kümelerinin eğitimi ve ardından eğitilen modeller farklı şeylerdir: Aynı veri kümesini alabilirsiniz ve aynı modeli tutarlı bir şekilde yeniden oluşturmanız her zaman mümkün olmayacaktır.

Maffulli, “Eğitim sırasında meydana gelen çeşitli istatistiksel ve rastgele mantıklar vardır, bu da onu yazılımla aynı şekilde tekrarlanabilir hale getiremeyeceği anlamına gelir” diye ekledi.

Bu nedenle, açık kaynaklı bir yapay zeka sisteminin, net talimatlarla çoğaltılması kolay olmalıdır. Açık Kaynak Yapay Zeka Tanımının kontrol listesi yönü de burada devreye giriyor. yakın zamanda yayınlanan akademik makale “Model Açıklık Çerçevesi: Yapay Zekada Tekrarlanabilirlik, Şeffaflık ve Kullanılabilirlik için Tamlık ve Açıklığın Teşviki” olarak adlandırılmıştır.

Bu makale, makine öğrenimi modellerini “tamlık ve açıklıklarına göre” derecelendiren bir sınıflandırma sistemi olan Model Açıklık Çerçevesini (MOF) önermektedir. MOF, eğitim metodolojileri ve model parametreleriyle ilgili ayrıntılar da dahil olmak üzere, AI modeli geliştirmenin belirli bileşenlerinin “uygun açık lisanslar altında dahil edilmesini ve yayınlanmasını” talep ediyor.

Stabil durum

Stefano Maffulli, Addis Ababa'daki Dijital Kamu Malları İttifakı (DPGA) üyeleri zirvesinde sunum yapıyor
Stefano Maffulli, Addis Ababa’daki Digital Public Goods Alliance (DPGA) üyeleri zirvesinde sunum yapıyor.
Resim Kredisi: OSI

OSI, tanımın resmi lansmanını, tıpkı bir şirketin prime time öncesinde kapsamlı test ve hata ayıklama sürecinden geçmiş bir uygulamaya yapacağı gibi, “kararlı sürüm” olarak adlandırıyor. OSI bunu kasıtlı olarak “son sürüm” olarak adlandırmıyor çünkü bazı kısımları muhtemelen gelişecek.

Maffulli, “Bu tanımın Açık Kaynak Tanımı gibi 26 yıl sürmesini gerçekten bekleyemeyiz” dedi. “Tanımın üst kısmının ‘Yapay zeka sistemi nedir?’ gibi bir kısmını beklemiyorum. – çok fazla değişmek. Peki kontrol listesinde bahsettiğimiz parçalar, bu bileşen listeleri teknolojiye mi bağlı? Yarın teknolojinin neye benzeyeceğini kim bilebilir?

Kararlı Açık Kaynak Yapay Zeka Tanımının Kurul tarafından onaylanması bekleniyor. Her Şey Açık konferansı Ekim ayının sonunda OSI, aradan geçen aylarda beş kıtayı kapsayan küresel bir tanıtım gezisine çıkarken, ileriye dönük olarak “açık kaynaklı yapay zeka”nın nasıl tanımlanacağı konusunda daha “çeşitli girdiler” arıyor. Ancak herhangi bir son değişikliğin, burada ve oradaki “küçük ayarlamalardan” biraz daha fazlası olması muhtemeldir.

Maffulli, “Bu son adım” dedi. “Tanımın tam versiyonuna ulaştık; ihtiyacımız olan tüm unsurlara sahibiz. Artık bir kontrol listemiz var ve bu listede herhangi bir sürpriz olup olmadığını kontrol ediyoruz; Dahil edilmesi veya hariç tutulması gereken hiçbir sistem yok.”



genel-24