Google’ın üretken yapay zeka dünyasında izlediği yolda önemli bir aşama olarak tanımlanabilecek bu gelişme, bu kez Mountain View devinin kurumsal sınıf müşterilerini de yakından etkiliyor. Bugün Kaliforniyalı şirket, DeepMind mühendisleri tarafından geliştirilen ve metin veya görüntülerden videolar oluşturmanıza olanak tanıyan tescilli Büyük Dil Modeli Veo’nun, Vertex makine öğrenimi platformu TO THE aracılığıyla Google Cloud müşterileri için özel önizleme olarak sunulacağını duyurdu. Bu duyurunun anlamı nedir? Bu arada BigG’nin, görüntüden videoya işlevsellik sunan ilk hiper ölçekleyici unvanına (istersek platonik) sahip olabileceği gerçeği. İkinci olarak, Veo’nun girişi sayesinde, tescilli model portföyünün (her şeyden önce büyük şirketlerin yararına) genişlemesi kesinlikle önemsiz değil; bunlardan 160’ı zaten üçüncü taraflardan ve açık kaynaktan temin edilebiliyor ve Vertex Modelinde kataloglanıyor. Bahçe
Veo nedir ve ne işe yarar?
Bu yıl mayıs ayında I/O’nun son baskısında tanıtılan Veo, Google DeepMind’dan doğan bir video oluşturma modelidir ve kullanıcı tarafından sağlanan göstergelere aslına sadık kalarak yanıt veren gerçekçi filmler oluşturmak için gelişmiş doğal dil ve görsel anlamsal anlama yeteneklerinden yararlanır. yaratıcı vizyonuna saygı duyuyorum. Başka bir deyişle, model, görüntünün kendi stilini ve metinsel talimatları takip eden metin isteminin yanı sıra girdi olarak bir görüntü içeren bir video oluşturabilir. Google’ın önceki modellere göre daha fazla aslına uygunluk ve daha az görsel eser vaat eden metinden resme modeli Imagen 3, Vertex AI’de piyasaya sürülmesiyle birlikte platformda halka açık hale geliyor. Resim 3, 3 Aralık’ta kullanım içindir.
Olası uygulamalar
Duyuru yazısında, Google Cloud müşterilerinin artık iki modeli Vertex AI üzerinde nasıl kullanabileceği, bazı kullanım durumları anlatılarak oldukça detaylı bir şekilde anlatıldı. Örneğin reklamcılıkla uğraşanlar, belirli bir ürünün veya nesnenin şekil ve özelliklerini koruyarak farklı bir ortamda görüntülerini ve videolarını daha kolay oluşturabilecekler. Ancak perakendeciler için, belirli bir giysiyi, öğeyi veya aksesuarı bir kişi üzerinde gösteren bir video klip oluşturmak, yalnızca o öğenin görüntüsünden başlayarak daha kolay olacaktır. Pazarlama alanında çalışanlar ayrıca sosyal medya ve diğer çevrimiçi kanallarda kullanılacak bloglar, etkinlikler ve diğer iletişim içerikleri için kaynak oluşturmak amacıyla Veo’yu (ve Imagen 3’ü) kullanabilecekler. Google, SynthID (iki model tarafından üretilen her görüntüye ve çerçeveye entegre edilen bir tür dijital filigran) ve zararlı içerik oluşturulmasını önlemek için tasarlanmış güvenlik filtreleri gibi araçların varlığı sayesinde, her şeyin son derece güvenli olduğunu garanti eder. Ayrıca, veri yönetimi konusunda şirket bir konsepti yinelemek istedi: LLM’leri eğitmek için müşteri verileri yalnızca onların talimatlarına göre işlenir ve izinsiz kullanılmaz.
BigG’nin Yüksek Lisans şablonlarını halihazırda kimler kullanıyor?
İtalyan şirketleri hala Gen AI’nın test aşamasındaysa, yurtdışında Mondelez International (Chips Ahoy!, Cadbury ve Oreo markalarıyla gıda sektöründe faaliyet gösteren çok uluslu bir ABD şirketi) veya Quora (2009’da kurulan bir topluluk) gibi şirketler de var. Mountain View ), metin veya resim istemlerinden videolar oluşturmak için zaten Google’ın geniş formatlı şablonlarını kullanıyor. Özellikle ilki, içerik üretim sürecini önemli ölçüde değiştirmek, yüz binlerce özelleştirilmiş varlık oluşturmak ve pazara sunma süresini ve maliyetleri önemli ölçüde azaltmak için Imagen 3’ün özelliklerinden yararlandı. Artık Veo, Mondelez ve ortak pazarlama ajanslarıyla bu yetenekleri video içeriğine genişletmek istiyor. Benzer şekilde Quora, fikirlerin yüksek kaliteli, üretken videolar aracılığıyla milyonlarca kullanıcıyla paylaşılmasını kolaylaştırmak için (Poe platformu aracılığıyla) yeni modeli kullanacak. Google’ın masaya getirdiği diğer önemli referanslar ise Puma, Warner Bros ve Mercedes’tir. Bunlardan ilki, tıklama oranlarını artıran ve dünya çapında marka dijital kampanyalarının pazara çıkış süresini hızlandıran dinamik, kişiselleştirilmiş ürün görselleri oluşturmak için Vertex AI üzerinde IImagen 2’yi kullanmak. İkincisi, Discovery’nin altyazı çözümüne, insan denetiminin yardımıyla altyazıları optimize etmek için Google Cloud platformunu kullanan bir iş akışı ekledi. Son olarak Alman otomobil üreticisi, uluslararası pazarlama kampanyalarını daha kişisel ve alakalı hale getirmek için Vertex AI ve Gemini modelleri de dahil olmak üzere Gen AI araçlarından yararlanıyor.