Apple, yeni bir büyük dil modeli ailesi yayınladı, bunu tamamen açık kaynak haline getirdi ve popüler yapay zeka platformunda sundu Sarılma Yüz diğer geliştiricilerin oynaması ve uyum sağlaması için.
iPhone üreticisi, son birkaç aydır açık kaynaklı yapay zeka alanında oldukça aktif hale geldi ve şirket, son sürümüyle bu cihaz içi dil modelleri kullanılarak oluşturulan uygulamaların yönünü şekillendirmeye yardımcı olmayı umuyor.
OpenELM, akıllı telefonlar veya dizüstü bilgisayarlar gibi uç cihazlarda iyi çalışacak şekilde tasarlanmış bir çerçevedir. Yapay zekayı yerel olarak çalıştırmak daha güvenli ve gizlilik açısından daha iyi olduğundan bu Apple için önemlidir.
Bu modellerin Apple’ın iOS 18’deki cihaz içi yapay zeka planlarının bir parçası mı yoksa Siri’ye yükseltme mi yapacağına dair bir gösterge yok, ancak şirketin yapay zeka konusunda gittiği yönü gösteriyorlar.
Apple OpenELM nedir?
Tam adı Açık Kaynak Verimli LLM’lerdir ve üçüncü taraf geliştiriciler ve araştırmacılar tarafından yeniden eğitilmek, uyarlanmak ve diğer projelere entegre edilmek üzere tasarlanmış eğitim modelleridir.
Bu yeni modeller daha doğru ve verimli olacak şekilde tasarlandı. Başlangıçta Apple’ın odak noktası, OpenLEM’in model önyargılarını, risklerini ve güvenilirlik düzeylerini araştırmak için kullanılabileceğinden araştırma topluluğuna destek sağlamaktır.
Ailede açık kaynak CoreNet veri kütüphanesinde önceden eğitilmiş dört model bulunmaktadır. Hepsi en büyüğü 3 milyar parametreye sahip küçük dil modelleridir. Bu, Microsoft’un yeni Phi-3 küçük dil modeline benzer bir boyuttur.
OpenELM’i farklı kılan nedir?
En büyük fark, diğer açık kaynak dil modellerine benzer performansın elde edilmesi, ancak çok daha küçük bir eğitim veri kümesinde elde edilmesidir. Bu, onu niş kullanım durumları ve araştırmalar için mükemmel kılar.
Apple araştırmacıları şunları yazdı: yeni modeller hakkında kağıt: “Yaklaşık bir milyar parametrelik parametre bütçesi ile OpenELM, diğer benzer boyutlu modellere kıyasla doğrulukta %2,36 oranında bir iyileşme sergiliyor”.
Yeni modellerin piyasaya sürülmesiyle birlikte Apple, MLX kütüphanesini kullanmak için kod da sundu. Bu, Apple’ın Stable Diffusion gibi yapay zeka modellerini kendi yonga setlerinde çalıştırmak için kullandığı araç setidir.
Modelleri Apple’ın kendi çiplerini çalıştıran uç cihazlara dağıtabilmek, giyilebilir teknoloji için de oyun değişiklikleri olabilir. Çevrimdışıyken bile çevre hakkında bilgi sunmak için yerleşik bir yapay zeka kullanan gelecekteki Apple AR gözlüklerini görebiliyorduk.
Bu iPhone’un geleceği açısından ne anlama geliyor?
OpenELM öncelikle bir araştırma projesidir; veri bilimcileri ve AI modellerinin güvenliğini ve doğruluğunu araştıran kişilerin kodu daha verimli bir şekilde çalıştırmasının bir yoludur.
Ancak bu, Apple’ın iPhone’lar, iPad’ler ve MacBook’lar gibi cihazlarda kapasiteden ödün vermeden verimli bir şekilde çalışabilen yapay zeka modelleri oluşturma konusundaki kararlılığını da gösteriyor.
Siri’nin her zaman Alexa ve Google Assistant gibi diğer eski AI sohbet robotları kadar iyi görülmemesinin bir nedeni, Apple’ın işlevlerinin çoğunun cihazda çalışıyor olması, yani karmaşık görevler için o kadar fazla bilgi işlem gücünden yararlanamamasıydı.
Bellek kullanımının verimliliğini artırmaya yönelik araştırmalar, sinir motorunu kullanan modellerin çalıştırılması ve tek bir istemle çalışan yeni dil modelleri de dahil olmak üzere Apple’ın yapay zeka üzerindeki son çalışmalarının çoğu bu hedefe yöneliktir ve OpenELM de farklı değildir. Hatta geliştiricilerin uygulamalarda yapay zeka için kullanabileceği bir çerçeveye bile yol açabilir.