Apple’ın yapay zeka konusunda geç kaldığını düşünmek kolay olurdu. ChatGPT’nin dünyayı kasıp kavurduğu 2022’nin sonlarından bu yana, Apple’ın rakiplerinin çoğu onlara yetişmek için kendilerini zorladı. Apple kesinlikle yapay zeka hakkında konuşmuş ve hatta yapay zekayı göz önünde bulundurarak bazı ürünler piyasaya sürmüş olsa da, balıklama dalmak yerine ayak parmağını daldırıyor gibi görünüyordu.

Ancak son birkaç aydır söylentiler ve raporlar, Apple’ın aslında sadece zamanını beklediğini ve harekete geçmek için beklediğini öne sürüyor. Son haftalarda Apple’ın bazı yapay zeka özelliklerinin güçlendirilmesi konusunda hem OpenAI hem de Google ile görüştüğü ve şirketin ayrıca Ajax adı verilen kendi modeli üzerinde çalıştığına dair raporlar var.

Apple’ın yayınlanan yapay zeka araştırmalarına bakarsanız, Apple’ın yapay zeka yaklaşımının nasıl hayata geçebileceğine dair bir resim oluşmaya başlıyor. Açıkçası, araştırma makalelerine dayanarak ürün varsayımları yapmak son derece hatalı bir bilimdir; araştırmadan mağaza raflarına kadar olan çizgi rüzgarlı ve çukurlarla doludur. Ama en azından şirketin ne olduğu hakkında bir fikir edinebilirsiniz. düşünme Apple, Haziran ayında yıllık geliştirici konferansı WWDC’de bunlar hakkında konuşmaya başladığında yapay zeka özelliklerinin ve bunların nasıl çalışabileceği hakkında konuşacağız.

Daha küçük, daha verimli modeller

Sanırım sen ve ben burada aynı şeyi umuyoruz: Daha iyi Siri. Görünüşe göre Daha İyi Siri geliyor! Apple’ın araştırmalarının çoğunda (ve teknoloji endüstrisinde, dünyada ve her yerde) büyük dil modellerinin sanal asistanları anında daha iyi ve daha akıllı hale getireceğine dair bir varsayım var. Apple için Daha İyi Siri’ye ulaşmak, bu modelleri olabildiğince hızlı hale getirmek ve bunların her yerde olmasını sağlamak anlamına geliyor.

Apple, iOS 18’de tüm yapay zeka özelliklerinin cihaz üzerinde, tamamen çevrimdışı bir modelde çalışmasını planlıyor. Bloomberg son zamanlarda rapor edildi. Veri merkezlerinden oluşan bir ağınız ve son teknoloji ürünü binlerce GPU’nuz olsa bile çok amaçlı iyi bir model oluşturmak zordur; bunu yalnızca akıllı telefonunuzun içindeki cesaretle yapmak çok daha zordur. Bu yüzden Apple’ın yaratıcı olması gerekiyor.

“adlı bir makaledeKısa sürede Yüksek Lisans: Sınırlı Bellekle Verimli Büyük Dil Modeli Çıkarımı” (tüm bu makalelerin gerçekten sıkıcı başlıkları var ama gerçekten ilginç, söz veriyorum!), Araştırmacılar, genellikle cihazınızın RAM’inde depolanan bir modelin verilerini bunun yerine SSD’de depolamak için bir sistem tasarladılar. “Mevcut DRAM’in iki katına kadar LLM’leri çalıştırma yeteneğini gösterdik [on the SSD]” diye yazdı araştırmacılar, “CPU’da geleneksel yükleme yöntemlerine kıyasla çıkarım hızında 4-5 kat, GPU’da ise 20-25 kat hızlanma elde ediliyor.” Cihazınızdaki en ucuz ve mevcut depolama alanından yararlanarak modellerin daha hızlı ve daha verimli çalışabildiğini buldular.

Apple’ın araştırmacıları ayrıca şu adı taşıyan bir sistem oluşturdu: EELBERT Bu aslında bir LLM’yi anlamlı bir şekilde daha kötü hale getirmeden çok daha küçük bir boyuta sıkıştırabilir. Google’ın Bert modelinin sıkıştırılmış hali 15 kat daha küçüktü (yalnızca 1,2 megabayt) ve kalitede yalnızca yüzde 4’lük bir düşüş görüldü. Yine de bazı gecikme değişimleriyle birlikte geldi.

Genel olarak Apple, model dünyasındaki temel bir gerilimi çözmeye çalışıyor: Bir model ne kadar büyürse o kadar iyi ve kullanışlı olabilir, ancak aynı zamanda o kadar hantal, güce aç ve yavaş da olabilir. Diğerleri gibi şirket de tüm bunlar arasında doğru dengeyi bulmaya çalışırken aynı zamanda hepsine sahip olmanın bir yolunu arıyor.

Siri ama iyi

Yapay zeka ürünleri hakkında konuştuğumuzda konuştuğumuz şeylerin çoğu sanal asistanlardır; bir şeyler bilen, bize bir şeyler hatırlatabilen, soruları yanıtlayabilen ve bizim adımıza işleri halledebilen asistanlar. Dolayısıyla Apple’ın yapay zeka araştırmalarının çoğunun tek bir soruya indirgenmesi pek de şaşırtıcı değil: Ya Siri gerçekten çok çok iyiyse?

Bir grup Apple araştırmacısı üzerinde çalışıyor Siri’yi kullanmanın bir yolu hiçbir uyandırma sözcüğü kullanmaya gerek kalmadan; Cihaz, “Hey Siri” veya “Siri”yi dinlemek yerine onunla konuşup konuşmadığınızı kolayca sezebilir. Araştırmacılar şunu kabul etti: “Bu sorun, ses tetikleyicisinin tespitinden önemli ölçüde daha zordur, çünkü bir sesli komutun başlangıcını işaret eden öncü bir tetikleyici ifade olmayabilir.” Başka bir grup araştırmacının bir sistem geliştirmesinin nedeni bu olabilir. uyandırma sözcüklerini daha doğru bir şekilde algılamak. Başka bir makale asistanlar tarafından genellikle iyi anlaşılmayan nadir kelimeleri daha iyi anlamak için bir model eğitti.

Her iki durumda da Yüksek Lisans’ın çekiciliği, teorik olarak çok daha fazla bilgiyi çok daha hızlı işleyebilmesidir. Örneğin uyandırma belgesinde araştırmacılar şunu buldu: Olumsuz Tüm gereksiz sesleri atmaya çalışmak yerine hepsini modele beslemek ve onun önemli olan ve olmayan şeyleri işlemesine izin vermek, uyandırma sözcüğü çok daha güvenilir bir şekilde çalıştı.

Siri sizi duyduğunda Apple, sizi daha iyi anladığından ve daha iyi iletişim kurduğundan emin olmak için birçok çalışma yapıyor demektir. Bir makalede geliştirildi STEER adı verilen bir sistem (Semantik Dönüş Uzantısı-Genişleme Tanıma anlamına gelir, bu yüzden STEER’i kullanacağız) bir takip sorusunu ne zaman ve ne zaman sorduğunuzu anlamaya çalışarak bir asistanla ileri geri iletişiminizi geliştirmeyi amaçlamaktadır. yeni bir tane soruyorsun. Bir diğerinde, nasıl söylerseniz söyleyin ne demek istediğinizi anlamak için “belirsiz sorguları” daha iyi anlamak için Yüksek Lisans’ı kullanır. “Belirsiz durumlarda” diye yazdılar, “akıllı konuşmacıların proaktif olarak iyi sorular sorarak belirsizliklerini azaltmak için inisiyatif almaları ve böylece sorunları daha etkili bir şekilde çözmeleri gerekebilir.” Başka bir makale bu konuda da yardımcı olmayı amaçlıyor: Araştırmacılar, asistanların cevaplar üretirken daha az ayrıntılı ve daha anlaşılır olmasını sağlamak için Yüksek Lisans’ı kullandılar.

Çok yakında, yalnızca değişiklikleri isteyerek resimlerinizi düzenleyebileceksiniz.
Resim: Elma

Sağlıkta yapay zeka, görüntü düzenleyiciler, Memoji’lerinizde

Apple, yapay zeka hakkında kamuya açık bir şekilde konuştuğunda, ham teknolojik güce daha az, yapay zekanın sizin için gerçekten yapabileceği günlük şeylere daha fazla odaklanma eğilimindedir. Dolayısıyla, Siri’ye çok fazla odaklanılıyor olsa da – özellikle de Apple, Humane AI Pin, Rabbit R1 ve Google’ın Gemini’yi tüm Android’e parçalaması gibi cihazlarla rekabet etmeye çalışırken – Apple’ın gördüğü birçok başka yol da var. Yapay zeka faydalıdır.

Apple’ın odaklanacağı bariz alanlardan biri de sağlıktır: Yüksek Lisans teorik olarak çeşitli cihazlarınız tarafından toplanan biyometrik veriler okyanusunda ilerlemenize ve bunların hepsini anlamanıza yardımcı olabilir. Bu nedenle Apple, tüm hareket verilerinizi nasıl toplayıp derleyeceğinizi, sizi tanımlamak için yürüyüş tanımayı ve kulaklığınızı nasıl kullanacağınızı ve kalp atış hızı verilerinizi nasıl izleyip anlayacağınızı araştırıyor. Apple ayrıca birden fazla vücut üstü sensöre sahip 50 katılımcıdan veri topladıktan sonra mevcut olan “en büyük çok cihazlı, çok konumlu sensör tabanlı insan etkinliği veri kümesini” oluşturup yayınladı.

Apple ayrıca yapay zekayı yaratıcı bir araç olarak hayal ediyor gibi görünüyor. Bir makale için araştırmacılar bir grup animatör, tasarımcı ve mühendisle röportaj yaptı ve Keyframer adı verilen bir sistem “etkinleştirmek[s] kullanıcıların oluşturulan tasarımları yinelemeli olarak oluşturmasına ve iyileştirmesine olanak tanıyor.” Bir bilgi istemi yazıp bir görüntü almak ve ardından başka bir görüntü almak için başka bir istem yazmak yerine, bir bilgi istemiyle başlarsınız, ancak ardından görüntünün bazı kısımlarını beğeninize göre ayarlayıp hassaslaştırmak için bir araç seti alırsınız. Bu tür ileri geri sanatsal süreçlerin Memoji yaratıcısından Apple’ın daha profesyonel sanatsal araçlarına kadar her yerde ortaya çıktığını hayal edebilirsiniz.

İçinde başka bir kağıtApple, yalnızca yapmak istediğiniz düzenlemeleri açıklayarak bir görüntüyü düzenlemenize olanak tanıyan MGIE adlı bir aracı açıklar. (“Gökyüzünü daha mavi yap”, “yüzümü daha az tuhaf yap”, “biraz taş ekle” ve benzeri şeyler.) “Kısa ama belirsiz rehberlik yerine, MGIE açık görsel bilinçli niyet türetiyor ve makul görüntü düzenlemeye yol açıyor ” diye yazdı araştırmacılar. İlk deneyleri mükemmel değildi ama etkileyiciydi.

Hatta Apple Music’te biraz yapay zeka bile elde edebiliriz: “Kaynak Kısıtlı Stereo Şarkı Sesi İptali“Araştırmacılar, şarkılardaki sesleri enstrümanlardan ayırmanın yollarını keşfettiler; bu, Apple insanlara, örneğin şarkıları TikTok veya Instagram’da yapabileceğiniz şekilde remikslemeleri için araçlar vermek isterse kullanışlı olabilir.

Gelecekte Siri telefonunuzu sizin için anlayabilir ve kullanabilir.
Resim: Elma

İddiaya girerim ki zamanla Apple’ın özellikle iOS’ta bu tür konulara eğileceğini göreceksiniz. Bunların bir kısmını Apple kendi uygulamalarına dahil edecek; bazılarını üçüncü taraf geliştiricilere API olarak sunacak. (En son Günlük Tutma Önerileri özelliği muhtemelen bunun nasıl çalışabileceğine dair iyi bir rehberdir.) Apple, özellikle ortalama Android cihazınızla karşılaştırıldığında, donanım yeteneklerini her zaman öne çıkarmıştır; Tüm bu beygir gücünü cihazdaki gizlilik odaklı yapay zeka ile eşleştirmek büyük bir fark yaratabilir.

Ancak Apple’da en büyük, en iddialı yapay zeka olayını görmek istiyorsanız şunları bilmeniz gerekir: Gelincik. Ferret, talimat alabilen, daire içine aldığınız veya başka bir şekilde seçtiğiniz belirli bir şeye odaklanabilen ve etrafındaki dünyayı anlayabilen, çok modlu, geniş bir dil modelidir. Artık normal olan yapay zekanın bir cihaza çevrenizdeki dünya hakkında soru sorması için tasarlandı, ancak aynı zamanda ekranınızdakileri de anlayabilir. Ferret makalesinde araştırmacılar, bunun uygulamalarda gezinmenize, App Store derecelendirmeleriyle ilgili soruları yanıtlamanıza, neye baktığınızı açıklamanıza ve daha fazlasına yardımcı olabileceğini gösteriyor. Bunun erişilebilirlik açısından gerçekten heyecan verici sonuçları var ama aynı zamanda bir gün telefonunuzu ve Vision Pro’nuzu ve/veya akıllı gözlüklerinizi kullanma şeklinizi de tamamen değiştirebilir.

Burada kendimizin çok ilerisine gidiyoruz, ancak bunun Apple’ın üzerinde çalıştığı diğer bazı şeylerle nasıl çalışacağını hayal edebilirsiniz. Ne istediğinizi anlayabilen bir Siri, ekranınızda olup biten her şeyi görebilen ve anlayabilen bir cihazla eşleştirildiğinde, kelimenin tam anlamıyla kendi kendini kullanabilen bir telefondur. Apple’ın her şeyle derin entegrasyonlara ihtiyacı olmayacak; uygulamaları çalıştırabilir ve otomatik olarak doğru düğmelere dokunabilir.

Tekrar belirtmek isterim ki, tüm bunlar sadece bir araştırmadır ve bu bahardan başlayarak tüm bunların iyi bir şekilde işlemesi, yasal olarak duyulmamış bir teknik başarı olacaktır. (Demek istediğim, chatbot’ları denediniz – harika olmadıklarını biliyorsunuz.) Ama her şeye bahse girerim ki WWDC’de bazı büyük yapay zeka duyuruları alacağız. Hatta Apple CEO’su Tim Cook Şubat ayında bununla ilgili şaka yapmıştı ve bu haftaki kazanç açıklamasında bunun sözünü vermişti. Ve iki şey çok açık: Apple yapay zeka yarışının içinde ve bu iPhone’un tamamen elden geçirilmesi anlamına gelebilir. Hatta Siri’yi isteyerek kullanmaya bile başlayabilirsiniz! Ve bu oldukça büyük bir başarı olurdu.



genel-2