Yapay zeka araştırmacısı ve veri gazetecisi Simon Willison şunları kullandı: Google AI Stüdyosu 12 e-postanın 35 saniyelik ekran kaydını tek bir e-tabloya dönüştüren araç. Bu deney, yapay zekanın bu kadar düşük bir maliyetle doğru sonuçlar vermesini beklemeyen Willison’ı şaşırttı. Buna göre onun blogu (s/t Ars Teknik), AI Studio bu eylem için ondan 11.018 token ücretlendirdi ve milyon token başına 7,5 sentlik bir maliyetle bu uygulama 1 sentin %10’undan daha azına tekabül ediyor.
Willison, 12 e-postaya dağılmış verileri manuel olarak aramak, verileri bir e-tabloya kopyalamak ve daha sonra oradan üzerinde çalışmak istemedi. Bunun yerine inanılmaz derecede basit bir istem oluşturdular: “Bunu, her öğenin bir yyyy-aa-gg tarihine ve o tarih için kayan noktalı dolar tutarına sahip olduğu bir JSON dizisine dönüştürün”. Bu komut, 35 saniyelik video boyunca arama yaptı ve tüm verileri döndürdü. JSON biçimli nesneler.
{
"date": "2023-01-01",
"amount": 2...
},
...
Bu daha sonra bir e-tabloya kolayca aktarılabilmesi için CSV formatında biçimlendirildi. Willison sürece tam olarak güvenmiyordu ama onları hayrete düşürecek şekilde sıfır hatayla doğru şekilde çalıştı!
Bu görevin maliyeti? Bir sentten az! Aslında ücretsizdi çünkü Google AI Studio şu anda ücretsiz. Ancak potansiyel maliyetlerin yararına, Willison rakamları yaptı. Kazara Gemini 1.5 Flash 002’yi kullandılar. Başlangıçta Gemini 1.5 Pro’yu kullanmayı planlayan Google’ın en iyi modeli Willison’u iddia ediyor. Ama Willison’un matematiğini takip edelim
11.018 jetona mal oldu (bunun 10.326’sı video işleme içindi). Gemini 1.5 Flash, bir milyon token başına 0,075 ABD doları ücret alıyor.
11018/1000000 = 0,011018
0,011018 * 0,075 USD = 0,00082635 USD
Yani eğer Willison ödüyor olsaydı, maliyeti bir sentin 10’da 1’i olurdu!
Gelen kutunuzdaki birkaç mesajdan veri toplamak, herhangi bir otomatik yardım gerektirmeyen kolay bir iş gibi görünse de, yüz hatta binlerce e-postadan veri bulmanız gerekiyorsa bu farklı bir hikaye olacaktır. Gelen kutunuzu kazımak için bir API kullanmak veya Google’ın Gmail’de kendi Gemini aracını kullanmak gibi, ekranı kaydetmenin ve verileri yapay zekaya beslemenin başka alternatifleri de var. Bununla birlikte, ilki, çoğu kullanıcının muhtemelen aşina olmadığı bazı programlama bilgisi gerektirirken, ikincisinin, Gemini’ye gelen kutunuza tam erişim izni verme konusunda sizi tedirgin edebilecek kendi sorunları vardır.
Video kazımayı bu kadar güçlü bir araç yapan şey, kimsenin onu kullanmasının fazla çaba gerektirmemesidir – tek ihtiyacınız olan ekranınızı yakalamanın bir yolu ve çok modlu bir araçtır (Gemini 1.5 gibi) ve bir veritabanı üretebilir ekranınıza kaydettiğiniz bilgilerden. Herhangi bir uzmanlık bilgisi gerektirmemesinin yanı sıra, potansiyel olarak herhangi bir kaynaktan veri çıkarabilirsiniz. Örneğin Amazon, web tarayıcılarının onu kazımasını engelliyor ancak yine de sayfalarını son kullanıcılara göstermesi gerekiyor. Dolayısıyla, 100 üründen veri toplamanız gerekiyorsa, ihtiyacınız olan öğelere ait sayfayı açarken ekranınızı kaydedebilir ve ardından yapay zeka aracınızdan bilgileri çıkarmasını isteyebilirsiniz. Bu hala bir web kazıyıcı kurmak ve işini yapmasına izin vermek kadar kolay olmasa da, tüm işi manuel olarak yapmaktan çok daha hızlıdır ve hataya daha az eğilimlidir.
Bu aslında Microsoft’un Copilot+ PC’leriyle tanıttığı tartışmalı Geri Çağırma aracı ve macOS için kullanılabilen üçüncü taraf Rewind AI aracıyla aynı konsepttir. Bununla birlikte, bu araçlar verilerinizi yalnızca yerel olarak uyumlu cihazlarda işlese bile, yine de doğası gereği bir gizlilik sorununa sahiptirler çünkü bilgisayarınızı her kullandığınızda ekranınızı kaydederler ve bunları yerel bir klasörde saklarlar. Ekran görüntüleri buluta yüklenmese bile bilgisayarınızda tek bir yere kaydedilmesi verilerinizi savunmasız hale getirir.
Bunu deneyecek bir sonraki kişinin neyi başaracağını merak ediyoruz.