Apple’ın makine öğrenimi (ML) ekipleri, Apple Silicon için yeni bir makine öğrenimi çerçevesi yayınladı: MLX veya ML Explore, kullanıma sunulduktan sonra geliyor yaz boyunca test edildi ve şu anda mevcut GitHub aracılığıyla.
Apple Silicon için Makine Öğrenimi
bir X notu, Avni HannunApple’ın makine öğrenimi ekibinden , yazılımı şöyle adlandırıyor: “…Apple silikonu (yani dizüstü bilgisayarınız!) için özel olarak tasarlanmış etkili bir makine öğrenimi çerçevesi”
Buradaki fikir, Apple donanımını kullanan araştırmacılar için makine öğrenimi modellerinin eğitimini ve dağıtımını kolaylaştırmasıdır. MLX bir DiziApple’ın işlemcilerinde verimli ve esnek makine öğrenimi için tasarlanmış dizi benzeri çerçeve.
Bu, tüketiciye yönelik bir araç değildir; geliştiricilere makine öğrenimi modelleri oluşturabilecekleri güçlü bir ortam gibi görünen bir ortam sağlar. Şirket aynı zamanda geliştiricilerin kullanmak istediği dilleri zorlamak yerine onları benimsemeye çalışmış gibi görünüyor ve görünüşe göre bu süreçte güçlü LLM araçlarını da icat etmiş.
Geliştiricilere tanıdık
MLX tasarımı, aşağıdaki gibi mevcut çerçevelerden ilham almıştır: PyTorch, JaxVe Dizi Ateşi. Ancak MLX, aşağıdakiler için destek ekler: birleşik bellek modeliBu, dizilerin paylaşılan bellekte yaşadığı ve desteklenen cihaz türlerinden herhangi birinde veri kopyalama işlemi gerçekleştirilmeden işlemlerin gerçekleştirilebileceği anlamına gelir.
Ekip şöyle açıklıyor: “Python API, birkaç istisna dışında NumPy’yi yakından takip ediyor. MLX ayrıca Python API’sini yakından takip eden tam özellikli bir C++ API’sine de sahip.”
Yayına eşlik eden notlarda ayrıca şunlar belirtiliyor:
“Çerçevenin kullanıcı dostu olması ama yine de modelleri eğitmek ve dağıtmak için verimli olması amaçlanıyor…. Yeni fikirleri hızla keşfetme hedefiyle araştırmacıların MLX’i genişletmesini ve geliştirmesini kolaylaştırmayı amaçlıyoruz.”
İlk bakışta oldukça iyi
İlk bakışta MLX nispeten iyi görünüyor ve (açıklandığı gibi) GitHub), kendisini farklı kılan çeşitli özelliklerle donatılmıştır; örneğin tanıdık API’lerin kullanımı ve ayrıca:
- Şekillendirilebilir fonksiyon dönüşümleri: MLX, otomatik türev alma, otomatik vektörleştirme ve hesaplama grafiği optimizasyonu için şekillendirilebilir fonksiyon dönüşümlerine sahiptir.
- Tembel hesaplama: MLX’teki hesaplamalar tembeldir. Diziler yalnızca ihtiyaç duyulduğunda gerçekleşir.
- Dinamik grafik yapısı: MLX’teki hesaplama grafikleri dinamik olarak oluşturulur. İşlev bağımsız değişkenlerinin şekillerini değiştirmek yavaş derlemeleri tetiklemez ve hata ayıklama basit ve sezgiseldir.
- Çoklu cihaz: İşlemler desteklenen cihazlardan herhangi birinde (şu anda CPU ve GPU) çalıştırılabilir.
- Birleşik bellek: Altında birleşik bellek modeli, MLX’teki diziler paylaşılan bellekte yaşar. MLX dizilerindeki işlemler, desteklenen cihaz türlerinden herhangi birinde, verileri taşımadan gerçekleştirilebilir.
Zaten başarabildiği şey
Apple şunları sağladı: örneklerin toplanması MLX’in yapabilecekleri. Bunlar şirketin artık bir yüksek verimli dil modeli, Stabil Difüzyon kullanarak görüntü oluşturmaya yönelik güçlü araçlar ve yüksek doğrulukta konuşma tanıma. Bu, bu yılın başındaki iddialarla ve gelecekteki Vision Pro deneyimleri için sonsuz sanal dünya yaratılmasına ilişkin bazı spekülasyonlarla örtüşüyor.
Örnekler şunları içerir:
- Bir Transformer LM’yi eğitin veya LoRA ile ince ayar yapın.
- Mistral ile metin oluşturma.
- Kararlı Yayılma ile görüntü oluşturma.
- Whisper ile konuşma tanıma.
Geliştiriciler, geliştiriciler….
Sonuçta Apple makine öğrenimini demokratikleştirmek istiyor gibi görünüyor. Ekip, “MLX, makine öğrenimi araştırmacıları tarafından makine öğrenimi araştırmacıları için tasarlandı” diye açıklıyor.
Başka bir deyişle Apple, makine öğrenimi için açık, kullanımı kolay geliştirme ortamları oluşturma ihtiyacını fark etti. bu alanda daha fazla çalışmayı beslemek.
Apple’ın işlemcilerinin artık Mac, iPhone ve iPad de dahil olmak üzere tüm ürünlerinde çalıştığı göz önüne alındığında, MLX’in Apple Silicon’da yaşaması da önemlidir. Bu yongalarda GPU, CPU ve (muhtemelen bir noktada) Neural Engine’in kullanılması, diğer işlemcilerin en azından uç cihazlar açısından eşleşemeyeceği performansla makine öğrenimi modellerinin (gizlilik için) cihaz üzerinde yürütülmesine dönüşebilir .
Çok mu az, çok mu geç?
Open AI’nin Chat GPT’si ortaya çıktığında ortaya çıkan büyük heyecan göz önüne alındığında geçen sene bu zamanlarApple gerçekten partiye geç mi kaldı? Öyle düşünmüyorum.
Şirket, makine öğrenimi araştırmacılarını, üzerinde modeller oluşturulabilecek güçlü M3 Mac’ler de dahil olmak üzere, yapabileceği en iyi araçlarla donatmaya odaklanmaya açıkça karar verdi.
Şimdi bu ilgiyi geri kalanımızın keyif alabileceği uygulanabilir, insan odaklı yapay zeka araçlarına dönüştürmek istiyor. Apple’ın aslında henüz yeni başlayan yapay zeka endüstrisi savaşında mağlup olduğunu ilan etmek için henüz çok erken.
Lütfen beni takip edin Mastodonveya bana katılın AppleHolic’in barı ve ızgarası Ve Elma Tartışmalar MeWe’deki gruplar.
Telif Hakkı © 2023 IDG Communications, Inc.