Yapay zeka alanında işler o kadar hızlı ilerliyor ki, bütün bir kategorinin birkaç haftalık bir yükseliş ve düşüş yaşam döngüsü olabiliyor. Tavşan r1 veya Humane Pin gibi yapay zekaya özel donanım cihazları için durum böyle görünüyor – peki ufukta bir kurtarıcı var mı?
Bu cihazlarla ilgili en büyük sorunlardan biri gecikmeydi. Bir sorguyu kullanılabilir hale getirmek için makul bir yanıt almak çok uzun sürdü. Bunu ücretsiz bir uygulamada veya birkaç dolara mal olan bir uygulamada affediyoruz; ancak yüzlerce dolara mal olan bağımsız bir cihazda değil.
Sonuç olarak, her iki cihaz da neredeyse evrensel eleştirilere ve teknoloji medyası yelpazesindeki korkunç incelemelere maruz kaldı, ancak ben her zaman en büyük sorunlarının erken olması olduğunu düşünmüşümdür.
Gecikme sorunlarından bazıları önbelleklemeyle çözülebilirdi ancak asıl sorun, görüş modellerinin çok yavaş olmasıydı. OpenAI’nin yeni GPT-4o’su ve hatta Google’ın Gemini Flash’ı ile erteleme mümkün olabilir – eğer iyi bir ikinci ilk izlenim yaratabilirlerse.
GPT-4o yapay zeka donanımı için neden bu kadar kullanışlı?
GPT-4o, başlangıçtan itibaren çok modlu giriş ve çıkış yapacak şekilde eğitilmiştir. Bu, önemli ölçüde daha iyi görme kapasitesinin yanı sıra konuşma, video ve metinleri anlama becerisine sahip olduğu anlamına gelir. Aynı zamanda daha hızlı olması için GPT-4’ü kılavuz olarak kullanarak sıfırdan eğitilmiş, etkili bir şekilde yeni bir modeldir.
Humane’in ürün tasarım lideri George Kedenburg III, X’e giderek önceki nesillere kıyasla GPT-4o ile yapılan testlerde gözle görülür bir iyileşme gördüklerini söyledi.
Örneğin gecikmede %14 azalma, %28 daha kısa yanıtlar ve %33 daha az kötü yanıt oldu. “Rakamların ötesinde her şey daha akıllı ve daha doğru geliyor” diye yazdı.
ChatGPT’de GPT-4o’yu denerseniz tüm bunları görebilirsiniz. Önceki sürümlerle karşılaştırıldığında önemli ölçüde daha hızlı yanıt veriyor, daha az ayrıntılı ve daha yetenekli görünüyor.
Rabbit’in kurucusu Rabbit CEO’su Jesse Lyu da GPT-4o’ya geçeceklerini belirterek, şunları söyledi: “Oyun birbirini öldürmüyor, herkes aynı temeller üzerinde çalışıyor. Temeller sağlamlaştığında bina onun üstüne çıkar. çok daha farklı olacak.”
Yapay zeka donanımı aptalca bir hile değil mi?
Yapay zekaya özel donanım bir hile gibi görünse de, özellikle artık r1’in yalnızca bir Android uygulaması olduğunu biliyoruz, bence bu, gelecekte bilgiye nasıl erişeceğimizin erken bir göstergesi.
Bu durum, Tom’s Guide’dan Jason England’ın gururla “bu asistanı kullanmanın en iyi yolunun halihazırda cebinizde bulunan cihazda, yani akıllı telefonda kullanmak olduğunu” beyan etmesiyle aramı bozuyor.
O hatalı değil. Akıllı telefon, ChatGPT Voice, Gemini Live veya Apple’ın WWDC’de sunduğu her şey gibi akıllı asistanlarla etkileşim kurmanın harika bir yoludur – ancak bu bir geçici çözümdür.
OpenAI Bahar Güncellemesinde gördüğümüz şey, teknolojiyi kullanma şeklimizde daha müdahalesiz bir yapay zeka geleceğine doğru bir değişimdir. Yapay zekanın bizi ve içinde yaşadığımız dünyayı anlayabilmesi ve teknolojiyle iletişimimizi kolaylaştıracak bir bağlantı sağlamasıyla, metin girişi yerine ses ve görüntüye odaklanma.
Kağıt fikirleri yazmayı kolaylaştırdı – artık keski ve taş yok – ve daktilolar bu süreci daha da kolaylaştırdı. Mikroişlemci bilgisayarları her eve, akıllı telefonlar da onları her elin kullanımına koydu. Teknolojiye erişim her nesilde daha basit ve soyut hale geliyor.
Ama Tavşan ve İnsancıl için artık çok mu geç?
Daha önce yapay zeka ile etkileşim için ideal form faktörümün, ideal olarak ekran sağlamak için film kaplamalı bir çift akıllı gözlük olduğunu söylemiştim; ancak Meta Ray-Bans gibi sesler gayet iyi.
Humane ve Rabbit’in sahip olduğu şey, en azından perde arkasında yapay zekayla etkileşimi kolaylaştıran bir süreç, iş akışı ve sistemdir.
Her ikisinin de onlarla etkileşim şekliniz açısından ciddi sorunları var. Tavşan üzerindeki kaydırma tekerleği ve düğmenin geliştirilmiş sesle değiştirilmesi daha iyi olacaktır, çünkü hem onu hantal hale getirir hem de Pin’in projektörünü kullanan kişiler bunun değerinden daha fazla sorun olduğunu söyler – bu da sesli yanıtlara odaklanmalıdır.
Bilgiyle etkileşime geçmek için geliştirdikleri süreçleri ve bir kavram olarak yazmaktan uzaklaşma fikrini GPT-4o gibi daha akıllı bir yapay zeka modeliyle birleştirirseniz, o zaman yapay zeka donanımı için bazı yeşil filizler görmeye başlarsınız.
Her iki şirket için de mesele ikinci ilk izlenimi yaratmaktır. Zayıf gecikme, yanlışlıklar ve tepki tarzlarındaki sorunlar gibi tüm sorunlarla lansman yapmak, kötü bir izlenim bıraktı ve bunun üstesinden gelmek bir mücadele olacak. Ama bu kavramı göz ardı etmememiz gerektiğini düşünüyorum.
Rabbit r1 ilk bakışta anlamsız görünse de, özellikle de her şey bir akıllı telefonda kopyalanabildiğinden, çocuklar için bir cihaz olarak harika bir geleceğe sahip olabilir. Akıllı telefona ve diğer birçok uygulamaya güvenmeden bilgiyi hızlı bir şekilde bulmanın bir yolu.
İnsancıl Pin için – Star Trek’ten ilham alan çalışan bir iletişimci istiyorum, bu yüzden GERÇEKTEN ısı ve gecikme dahil birçok sorunu çözebileceklerini umuyorum. GPT-4o’nun ses yetenekleri ve canlı çevirisiyle birleştirildiğinde bu, hayata geri dönebilir.
Ancak ben bir teknoloji iyimseriyim ve “hepsine hükmedecek tek bir cihazın” olacağını düşünmüyorum. Benim görüşüme göre insanlar kendileri için rahat olan farklı form faktörlerini isteyeceklerdir. Bazıları için her zaman akıllı telefon benzeri bir cihaz olacak, bazıları için ise gömleğine takılan basit bir iğne.