Yapay zeka, Las Vegas’taki son CES toplantısında gösterilen ve önümüzdeki aylarda daha da artması beklenen çeşitli donanım ve yazılım biçimlerine yayılan muğlak terimle 2023 için ilgi odağı haline gelmeyi vaat ediyor.
Lenovo Legion Pro gibi yenilenmiş üst düzey oyun dizüstü bilgisayarları, Lenovo LA çipi tarafından desteklenen makine öğrenimini kullanarak maksimum performans için dahili bileşenleri akıllıca yönetme becerisine sahiptir. Benzer otomatik ayarlama teknolojisi, diğer cihazlarda zaten mevcut ve bu da onu abartılı bir başlıkla nispeten heyecan verici olmayan bir olasılık haline getiriyor.
Bununla birlikte, ufukta sürünen yapay zekanın sözde duyarlılığının farklı bir yanı var; bu, genel halka açıldığında neredeyse eşit ölçüde yararlı ve kötü davranışa hizmet edebilir.
Şimdiye kadar inandırıcı olmayan ve robotik
Eğitim verilerine dayalı olarak insan konuşmasını sentezlemek için yapay zekanın kullanılması bir süredir uygulanmaktadır. Çeşitli şirketler, günlük tüketicilere daha doğal ve inandırıcı gelen bir şey geliştirmek için yıllardır teknolojiyle boğuşuyor. Yine de, çoğunlukla, sonuçlar genellikle tekinsiz vadide yuvarlanıyor.
Altta yatan teknoloji ne kadar fantastik olursa olsun, konuşmamızdaki ince nüansları mükemmel bir şekilde sergilemek karmaşıktır. Hepimiz ince aksanlara ayrılmış çeşitli dillerde konuşuyoruz ve hatta ritmimizde farklılık gösteriyoruz ve iki kişinin tam olarak aynı şekilde konuşması pek olası değil.
Kısa biçimli videolarda kaydedilmiş sesleri değiştirirken veya popüler film sahnelerinin komedi dublajlarında belirli bir ünlü vücut geliştirmecinin aksanını taklit ederken olsun, yalnızca eğlence için kullanılan sentezlenmiş konuşmayı duymamızın bir nedeni de budur.
Sağlık ve tıpta daha odaklı uygulamalar, bu son teknolojinin daha kapsamlı bir şekilde kullanılmasını sağlar ve yapay zekanın yardımıyla seslerini kullanmayı kaybedenlerin doğal bir şekilde tekrar konuşmalarına yardımcı olur. Profesör Stephen Hawking, DECtalk tabanlı sentez teknolojisindeki varsayılan ayar zaten kimliğinin tanınabilir bir parçası haline geldiğinden, ünlü robotik sesini bir başkasıyla değiştirme şansını kaçırması meşhur oldu.
Daha genç, doğal konuşan sesinin daha kapsamlı kayıtları mevcut olsaydı, son yapay zeka gelişmelerinden faydalanabilirdi, ancak adamın kendisi dışında kimse kesin olarak söyleyemezdi.
Microsoft, VALL-E’yi tanıttı
60.000 saatlik İngilizce konuşma verisi eğitimi, VALL-E adlı yeni bir yapay zeka sentez aracı (yeni sekmede açılır) ayrıntılı olarak bir Araştırma kağıdı (yeni sekmede açılır) Cornell Üniversitesi’nden, şimdi Microsoft’un mülkiyetinde. Yapay zekanın son yıllarda şirket için önemli bir odak noktası haline geldiği göz önüne alındığında, varlığı özellikle endişe verici değil. Sistemin şaşırtıcı derecede ikna edici sonuçlar üretmek için ne kadar az girdiye ihtiyaç duyduğuna dair açıklamalar, orijinal mesajla tamamen ilgisiz, tamamen yeni mesajlar oluşturmak için kullanılan üç saniyelik kayıtlarla bu sefer gerçek kaşları kaldıran faktör.
A VALL-E’nin GitHub’da gösterimi (yeni sekmede açılır) katı ve doğal olmayandan mükemmellik sınırına kadar değişen, herkesin duyabileceği çok sayıda ses örneği içerir. Makine öğrenimi motoru, aşağıdaki gibi nispeten ilkel alternatiflerin aksine, şu anda genel halk tarafından kullanılamamaktadır. ördek (yeni sekmede açılır)gerçekçi bir şekilde mevcut durumunda eğlenceli bir oyuncak gibi davranmaktan öteye gitmeyen.
Demonun altında, deneye dahil olan herkesin sonuçlara istekli ve onayladığını açıklayan tek paragraflık bir etik beyanı yer alır ve ardından bu tür bir teknolojinin her zaman tüm tarafların rızasına ilişkin bir anlaşmaya eşlik etmesi gerektiğine dair zımni bir uyarı gelir. VALL-E’nin çok küçük bir referans verisi ile bu kadar büyüleyici sonuçlar ürettiği göz önüne alındığında, açık dünyadaki kullanımlarının sonuçları karmaşıktır.
kimliğe bürünmenin anlamı
Gerçek hayattaki insanları taklit eden yapay zekaya olan hayranlığım, önce onun insanlığı nasıl zenginleştirebileceğini hayal etmemi sağlıyor. Daha doğal bir konuşma modeli, robotik arama operatörlerine duyulan isteksizliği azaltabilir veya kamusal alanlardaki bilgi panellerine yeni bir soluk getirebilir. Genel bilgi sağlama işlerini insanlaştırılmış makinelere boşaltmak, bazı temel yazılımlarda anahtar sözcükleri bağırmanın mevcut durumunu aşabilirse, tüketiciler için küçük konuşmaları atlamak anlamına gelebilir.
Konuşma sentezinin yaratıcı ve insancıl alanlarda kalmasını tercih etsem de, bunun yalnızca sesli kitaplar ve komik mem içeriği oluşturmaya uygulanması gerçeği ezici bir çoğunlukla olası değil.
Microsoft, VALL-E’nin temel çalışmalarını hiçbir zaman halka açık bir şekilde yayınlamasa bile, başka bir rakip, yeterli zaman verilirse, şüphesiz bir eşdeğerini icat ederdi.
Ne yazık ki, çocukluğumun en sevdiğim video oyunları ve TV şovlarındaki seslendirme sanatçıları ne yazık ki aramızdan ayrılmaya devam ediyor ve onların ikonik rollerinde performans sergilediklerini bir daha asla duymayacağıma dair kasvetli bir farkındalık bırakıyor. Yaratıcı yetenekler gelecekte seslerini korumayı kabul ederse, bu tür bir teknoloji heyecan verici uygulamalar görebilir, ancak her zaman olası bir kötüye kullanım hissi vardır. Katı yönergeler ve kontrol olmaksızın, ses sentezinin her yinelemesinde kötü niyetli taklitlerin olasılığı daha da artar.
Bu tür bir ileri geri düşünme, yapay zeka konusunda kararsız kalmamı sağlıyor ve üretilen seslerin gerçek bir sorun haline gelecek kadar inandırıcı hale gelmesinin ne kadar sürebileceğini her zaman merak ediyorum. Deepfake videoları zaten benzer tartışmalara yol açtı ve eşlik eden bir ses, bir kişiyi ikna edici bir şekilde taklit etmek için neredeyse tek eksik parça.
dikkatli yürümek
Yine Microsoft, yapay zekanın olanaklarına yabancı değil. Bing arama sonuçlarını ve tüm Office paketini artırmaya yönelik sözde planlarla, gelişen teknolojiyi edinmeleri ve bir başlangıç yapmaları mantıklı. Günlük kullandığım donanım ve yazılımları üreten bir şirkette nasıl büyüyebileceğini görmek heyecan verici. Yine de, sonunda hain bireyler veya gruplar tarafından rahatsız edici evlat edinmelere sahip olabileceğine dair her zaman kalıcı bir düşünce vardır.
Hâlâ teknolojinin gözü kara bir hayranıyım ve bunun gibi gelişmeler, her zaman günlük hayatımızı nasıl iyileştirebileceklerini hayal etmemi sağlayacak. Bununla birlikte, yetişkin hayatımın her gününü interneti kullanarak geçirdim ve yeni yazılımın amacının bazen nihai kullanımla nasıl uyumlu olmadığını gördüm.
Belki bir gün bedensiz sesim tüm makalelerimi yüksek sesle okuyacak, ancak Microsoft’un Excel elektronik tablolarımı şimdilik daha süslü hale getirmek için ne planladığını göreceğim. Belki Cortana daha konuşkan bir geri dönüş bile yapabilir; kim bilir?