Anthropic, Claude AI modeline, komutlara dayalı olarak genel bilgi işlem görevlerini gerçekleştirmeyi öğrettiğini söylüyor. İçinde gösteri videolarımodelin şehirde bir gezi için araştırma yapmak üzere bilgisayarın imlecini kontrol ettiği, kullanıcının evinin yakınındaki ziyaret edilecek yerleri internette aradığı ve hatta masaüstü takvimine bir seyahat programı eklediği gösterilmektedir.
İşlevsellik bugün yalnızca geliştiricilerin kullanımına açık ve fiyatlandırmanın nasıl göründüğü veya teknolojinin gerçekte ne kadar iyi çalıştığı belli değil. Antropik diyor ki cıvıldamak Claude, modelini test ederken kodlama ödevinden vazgeçip Google’da Yellowstone Milli Parkı’nın resimlerini aramaya başladığında yeni yetenekler hakkında konuştu. Yani evet… hâlâ çözülmesi gereken sorunlar var.
Teknik açıdan Anthropic, Claude’un ekran görüntüleri alıp bunları modele geri göndererek, imleç konumu ile tıklaması gereken düğme arasındaki mesafe dahil olmak üzere ekrandakileri inceleyerek ve komutları geri göndererek bir bilgisayarı kontrol edebildiğini söylüyor. bir göreve devam etmek.
Amazon ve Google gibi şirketler tarafından desteklenen Anthropic, Claude’un “kamuya açık beta sürümünde bilgisayar kullanımı sunan ilk öncü yapay zeka modeli” olduğunu söylüyor.
Otomatik bilgisayar kullanımının pratikte ne gibi yararlı olabileceği açık değildir. Antropik, bunun tekrarlayan görevleri veya açık uçlu araştırmaları gerçekleştirmek için kullanılabileceğini öne sürüyor. Birisi bu yeni işlevin nasıl kullanılacağını anlarsa, Reddit’teki /r/overemployed topluluğu muhtemelen ilk olacak. En azından Wells Fargo çalışanları için yeni bir fare oyunu olabilir. Ya da belki bunu yapmak için üçüncü taraf bir araç bulmanıza gerek kalmadan sosyal medya hesaplarınızı gözden geçirmek ve tüm eski gönderilerinizi silmek için kullanabilirsiniz. Görev açısından kritik olmayan veya gerçeklere dayalı doğruluk gerektirmeyen şeyler.
Yapay zeka alanında çok fazla heyecan olmasına ve şirketlerin yapay zeka sohbet robotları geliştirmek için milyarlarca dolar harcamasına rağmen, alandaki gelirin çoğu hala bu yapay zeka şirketlerine GPU sağlayan Nvidia gibi şirketler tarafından elde ediliyor. Antropik büyüdü 7 milyar dolardan fazla yalnızca geçen yıl.
En yeni moda teknoloji şirketleri, “acenteler” veya görevleri kendi başlarına tamamlayabilecekleri iddia edilen otonom botlar teknolojisini satmaya çalışıyor. Pazartesi günü Microsoft duyuruldu Copilot ile “potansiyel müşteri oluşturmayı hızlandırmak ve satış siparişlerini işlemekten tedarik zincirinizi otomatikleştirmeye kadar her şeyi” yapabilen otonom aracılar oluşturma yeteneği.
Salesforce CEO’su Marc Benioff küçümseyerek Microsoft’un ürününü hatalı olduğu için “Clippy 2.0” olarak adlandırdı; ancak elbette bunu Salesforce’un kendi rakip yapay zeka ürünlerini tanıtırken söylüyordu. Salesforce, müşterilerinin, müşteri destek e-postalarını yanıtlamak veya yeni müşteriler bulmak gibi amaçlara hizmet edebilecek kendi özel temsilcilerini oluşturmalarına olanak sağlamak istiyor.
Beyaz yakalı çalışanlar hala ChatGPT veya Claude gibi sohbet robotlarını kullanmıyor gibi görünüyor. Microsoft’un Yardımcı Pilot asistanının resepsiyonu ılıktı, sadece bir küçük kesir AI araçlarına erişim için ayda 30 ABD doları harcayan Microsoft 365 müşterilerinin oranı. Ancak Microsoft, tüm şirketini bu yapay zeka patlaması etrafında yeniden yönlendirdi ve yatırımcılara bu yatırımın geri dönüşünü göstermesi gerekiyor. Yani ajanlar yeni bir şey.
En büyük sorun, her zaman olduğu gibi, ChatGPT ve Google’ın Gemini’si gibi yapay zeka sohbet robotlarının gerçekte hatalı, kalitesiz veya bir insan tarafından yazılmadığı açıkça anlaşılan çok sayıda çıktı üretmesidir. Botun çıktısını düzeltmek ve temizlemek için gereken süre, ilk etapta ürettikleri verimliliği neredeyse boşa çıkarıyor. Boş zamanlarınızda tavşan deliklerine inmek için bu iyi bir şey ama işyerinde hatalarla dolu işler üretmek kabul edilemez. Claude’un e-postalarımı çılgına çevirerek insanlara yanıt olarak jargon göndermesi veya geri dönüp düzeltmem gereken başka bir görevi berbat etmesi konusunda gergin olurdum. OpenAI’nin kendisinin de kabul ettiği gerçek aktif kullanıcılarının çoğu öğrencidir bir nevi her şeyi söylüyor.
Yeni işlevselliğin kendisiyle ilgili bir tweette antropik itiraf ediyor bilgisayar kullanımının “düşük riskli görevlerle” test edilmesi gerektiği.