Son yıllarda dikkatler yapılandırılmamış verilere odaklandı: metin, grafikler, belgeler, IoT akışları, kısacası muazzam ve henüz kullanılmamış değer taşıyan tüm veri akışları. Bu arada, veritabanı endüstrisi bu varlıklara daha iyi uyum sağlamak ve bunlardan faydalanmak için dönüşüm geçirdi.

Ancak çoğu zaman yapılandırılmamış veri kaynaklarının bilinmemesi bu çabaları sekteye uğratmıştır. İş bilgilerinin tahminen %90’ı yapılandırılmamış verilerden oluşsa da kuruluşların yalnızca %46’sı bundan değer elde etmek için çalıştı. IDC araştırmasına göre.

Bugün işletmelerin yapılandırılmamış verileri arayıp gün ışığına çıkarmak için başka bir nedeni daha var: Üretken yapay zekanın yükselişi.

Katma değerli ancak karmaşık çalışma

Son yıllarda yapılandırılmamış verilerden yararlanmaya başlayan şirketler, üretken yapay zekanın avantajlarından yararlanma konusunda kendilerini daha iyi bir konumda bulabilirler. Ve tam tersine, veri ambarlarının derinliklerine inmek için yapay zekayı kullanmak.

İşletmelerin “IoT gibi kaynakların yanı sıra ofis belgeleri (PowerPoint’ler, metinler, Excel elektronik tabloları) gibi kaynaklardan gelen yapısal olmayan verileri yönetme” adımını atmasının zamanı geldi diyor Matt Labovich, PwC’de analist. “Hepsi, üretken yapay zeka kullanılarak yararlanılabilecek iş operasyonlarına ilişkin değerli bilgiler içeriyor.”

M .Labovich, geleneksel olarak şimdiye kadar en çok ilgiyi yapılandırılmış veri stratejilerine vermiş olsa da, “genel yapay zekanın geliştirilmesinde yapısal olmayan verilerin önemli rolüne” bakmanın zamanı geldiğinde ısrar ediyor.

Yine de önceki yapay zeka girişimleri, yapılandırılmış verilerin hazır ve bol olduğu kullanım senaryolarına odaklanmak zorundaydı; “heterojen veri kümelerini toplamanın, açıklama eklemenin ve sentezlemenin karmaşıklığı, daha geniş yapay zeka girişimlerini sürdürülemez hale getirdi” diye belirtiyor yakın tarihli bir çalışma soruşturma MIT Technology Review Insights’ta yayınlandı.

Veri sorunları yapay zeka hedeflerine zarar veriyor

Raporun yazarı, “Buna karşılık, üretken yapay zekanın önceden gizlenmiş verileri ortaya çıkarma ve kullanma konusundaki yeni yeteneği, kuruluş genelinde olağanüstü ilerlemeyi mümkün kılacak” diye yazıyor: Adam Yeşil.

Bu verileri yakalama ve ondan değer elde etme becerisinin her zamankinden daha önemli olduğu düşünülüyor.

Anket katılımcılarının yaklaşık %70’i, yapay zeka ve makine öğrenimi hedeflerinden ödün verme olasılığı en yüksek faktörün veri sorunları olduğu konusunda hemfikir. Green, “ChatGPT gibi metin üreten yapay zeka sistemleri büyük dil modelleri üzerine kuruludur” diyor. “LLM’ler, soruları yanıtlamak veya istatistiksel olasılıklara dayalı görevleri gerçekleştirmek için geniş bir veri kümesi üzerinde eğitim alıyor.

Veri platformlarını birleştirmek çok önemli

Green, yapay zeka uygulamalarının “veri evreninin toplanmasını, depolanmasını ve analiz edilmesini sağlayan sağlam bir veri altyapısına dayandığını” ekliyor. “Üretken yapay zekanın ticari uygulamaları 2022’nin sonlarında belirginleşmeden önce bile, yapay zeka için birleşik bir veri platformu, ankete katılanlarımızın yaklaşık %70’i tarafından çok önemli görülüyordu.”

Ankete katılanların üçte ikisinden fazlası, veri platformlarını birleştirmenin kurumsal veri stratejileri açısından çok önemli olduğu konusunda hemfikir. Üretken yapay zeka çağı esnek, ölçeklenebilir ve verimli veri altyapısı gerektirir. Önemli olan “verilere ve analizlere erişimi demokratikleştirmek, güvenliği güçlendirmek ve düşük maliyetli depolamayı yüksek performanslı sorgulamayla birleştirmektir.”

Yapay zeka için yapılandırılmamış verileri toplamak kolay bir iş değil. MIT raporunda Bay Green, “Birleşmeler ve satın almalar BT mimarilerinin parçalanmasına neden oldu. Ar-Ge veya fabrikalar için tasarım talimatları olsun önemli belgeler gözden kayboldu, çevrimdışı özel dosyalara kilitlendi” diye altını çiziyor.

“Bu belgeleri Yüksek Lisans kullanarak sorgulayabilir miyiz? Bu geniş belge dünyasında göremediğimiz bilgileri bize verecek modelleri eğitebilir miyiz?”

Buna göre Andrew BlytonIncyte’ın bilişim sorumlusu, “Bunun bariz bir kullanım durumu olduğunu düşünüyoruz. Dil modelleri, bu yapılandırılmamış verileri çok daha değerli kılmayı vaat ediyor.”


Kaynak : “ZDNet.com”



genel-15