Google Fotoğraflar, Google’ın Gemini AI modeli tarafından desteklenen deneysel bir özellik olan Ask Photos’un lansmanı ile bir AI aşısı alıyor. Bu yazın sonlarında kullanıma sunulacak yeni ekleme, kullanıcıların, yapay zekanın fotoğraflarının içeriğini ve diğer meta verilerini anlamasından yararlanan doğal dil sorgularını kullanarak Google Fotoğraflar koleksiyonlarında arama yapmasına olanak tanıyacak.

Google, Salı günü yıllık Google I etkinliğinde, kullanıcıların fotoğraflarında belirli kişileri, yerleri veya şeyleri arayabilmesinden önce, doğal dil işleme sayesinde yapay zeka yükseltmesinin doğru içeriği bulmayı daha sezgisel hale getireceğini ve manuel arama sürecini ortadan kaldıracağını duyurdu. /O 2024 geliştirici konferansı.

Örneğin, fotoğraflarınızda “Eyfel Kulesi” gibi belirli bir şeyi aramak yerine artık yapay zekadan “ziyaret ettiğim Milli Parkların her birinden en iyi fotoğrafı” bulmak gibi çok daha karmaşık bir şey yapmasını isteyebilirsiniz. Yapay zeka, fotoğrafı belirli bir sette neyin “en iyi” yaptığını belirlemek için aydınlatma, bulanıklık, arka planda bozulma olmaması ve daha fazlası dahil olmak üzere çeşitli sinyaller kullanır. Daha sonra bunu, yalnızca ABD Ulusal Parklarında çekilen görüntüleri almak için bir dizi fotoğrafın veya tarihin coğrafi konumunu anlama anlayışıyla birleştirebilir.

Resim Kredisi: Google

Bu özellik, neredeyse aynı olan fotoğrafları bir araya toplayan ve gruptaki en iyi fotoğrafları vurgulamak için yapay zekayı kullanan Google Fotoğraflar’da kısa süre önce kullanıma sunulan Fotoğraf Yığınları temel alınarak geliştirildi. Fotoğraf Yığınlarında olduğu gibi amaç, insanların dijital koleksiyonları büyüdükçe istedikleri fotoğrafları bulmalarına yardımcı olmaktır. Google’a göre size ölçek konusunda fikir vermesi açısından Google Fotoğraflar’a her gün 6 milyardan fazla resim yükleniyor.

Ek olarak, “Fotoğraf Sor” özelliği, kullanıcıların soru sorarak diğer türden yararlı yanıtlar almasına olanak tanıyacak. Kullanıcılar, bir tatilden veya başka bir gruptan en iyi fotoğrafları istemenin ötesinde, fotoğraflarında ne olduğuna dair neredeyse insani bir anlayış gerektiren sorular sorabilirler.

Örneğin, bir ebeveyn Google Fotoğraflar’a, çocuğunun son dört doğum günü partisinde hangi temaları kullandığını sorabilir ve deniz kızı, prenses ve tek boynuzlu at temalarının daha önce ve ne zaman kullanıldığına ilişkin fotoğraf ve videoların yanı sıra basit bir yanıt verebilir.

Resim Kredisi: Google

Bu tür bir sorgu, Google Fotoğraflar’ın yalnızca girdiğiniz anahtar kelimeleri değil aynı zamanda “temalı doğum günü partisi” gibi doğal dil kavramlarını da anlaması nedeniyle mümkün olmuştur. Ayrıca bir fotoğrafta sorguyla alakalı olabilecek bir metin olup olmadığını anlamak için yapay zekanın çok modlu yeteneklerinden de yararlanabilir.

Bugünkü Google I/O geliştirici konferansı öncesinde CEO Sundar Pichai tarafından basına sunulan bir başka örnekte, bir kullanıcının yapay zekadan çocuklarının yüzme gelişimini kendisine göstermesini istediği görüldü. Yapay zeka, zaman içinde yüzen çocuğun öne çıkan fotoğraflarını ve videolarını paketledi.

Başka bir yeni özellik, fotoğraflardaki metinlerden yanıt bulmak için aramanın kullanılmasından yararlanıyor. Bu şekilde, plakanız veya pasaport numaranız gibi daha sonra hatırlamak istediğiniz bir şeyin fotoğrafını çekebilir ve ihtiyaç duyduğunuzda yapay zekadan bu bilgiyi almasını isteyebilirsiniz.

Yapay zeka bir şeyleri yanlış anlarsa ve siz bunu düzeltirseniz (örneğin doğum günü partisine ait olmayan veya tatilinizden öne çıkarmayacağınız bir fotoğrafı işaretlerseniz), zaman içinde daha iyi olmak üzere bu yanıtı hatırlayacaktır. Bu aynı zamanda, onunla ne kadar uzun süre etkileşimde bulunursanız yapay zekanın sizin için daha kişisel hale geleceği anlamına gelir.

Paylaşmaya hazır olduğunuz fotoğrafları bulduğunuzda yapay zeka, fotoğrafların içeriğini özetleyen bir başlık taslağı hazırlamanıza yardımcı olabilir. Şimdilik bu, farklı tarzlar arasından seçim yapma seçeneğini sunmayan temel bir özettir. (Ancak Gemini’yi temel olarak kullandığı göz önüne alındığında, akıllıca yazılmış bir bilgi istemi, denerseniz belirli bir stil döndürmek için işe yarayabilir.)

Google, belirli durumlarda yanıt vermemek için korkulukların bulunacağını söylüyor (belki de yapay zekadan “en iyi çıplakları” istememek?). Ayrıca modeli eğitirken potansiyel olarak rahatsız edici içerik içermiyordu. Ancak özellik bir deneme olarak kullanıma sunuluyor, bu nedenle Google’ın insanların onu nasıl kullandığına yanıt vermesi nedeniyle zaman içinde ek kontrollerin eklenmesi gerekebilir.

Fotoğraf Sor özelliği, daha fazla pazara sunulmadan önce başlangıçta ABD’de İngilizce olarak desteklenecek. Bu aynı zamanda yapay zeka sohbet robotuna soru sormaya benzer şekilde şimdilik yalnızca metin tabanlı bir özellik olacak. Ancak zamanla, Android’de olduğu gibi cihazda çalışan Gemini ile daha derin bir şekilde entegre olabilir.

Şirket, kullanıcıların Google Fotoğraflar’daki kişisel verilerinin reklamlar için kullanılmadığını söylüyor. Google, “nadir durumlarda kötüye kullanım veya zararın ele alınması” dışında, Ask Photos’taki yapay zeka konuşmalarını ve kişisel verileri de insanların incelemeyeceğini söylüyor. İnsanların Google Fotoğraflar’daki kişisel verileri Gemini gibi başka hiçbir üretken yapay zeka ürününü eğitmek için de kullanılmaz.

TechCrunch'ta Google I/O 2024 hakkında daha fazla bilgi edinin



genel-24