Bu nedenle temel bir eğilim, kullanımlarının ve yeni hizmetlerin geliştirilmesinin giderek daha sınırlı veya uygulanması zor hale geldiğini görüyor. Sentetik veriler bu eğilimi tersine çevirmenin ve karar vericiler ile kullanıcılar arasında iyi bir güven düzeyini yeniden kazanmanın çözümü mü?

Gittikçe daha fazla şirket ve meslek, analiz etmek, optimize etmek ve hatta yeni hizmetler sağlamak için veri üretiyor ve bunlardan en iyi şekilde yararlanıyor. Büyümenin gerçek katalizörleri ve hızlandırıcıları olan veriler, yanlış kullanım durumunda bunları işleyen kullanıcılar veya şirketler için de birçok risk oluşturur.

Sonuç olarak, veri yönetişimi ve güvenliği artık CIO’ların en önemli öncelikleri arasında yer alıyor. Bu, doğru veya yanlış olarak, teknolojik olanaklar alanını, bunların işletmeler tarafından kullanılabilirliğini ve yeni hizmetler için pazara çıkış süresini sınırlayabilir.

Paylaşma ve yayma sorumluluğunun gerçek ve güçlü olması ve diğer bilgilerle çapraz kontrol yoluyla dolaylı olarak da dahil olmak üzere verilerin sunduğu riski değerlendirmenin karmaşıklığı, operasyonel personeli ve iş kollarını çok güçlü kısıtlamalara karar vermeye zorlayabilir. “Bu veriler şirkete, müşterilerine, çalışanlarına, vatandaşlara (üçüncü bir kişinin erişimine açıksa) zarar verebilir mi? herkesin aklında.

Sözde “klasik” çözümlerin sınırları

Bu sorunları gidermek için refleks, takma adlaştırma, anonimleştirme, birleştirme ve şaşırtma gibi “Klasik” çözümlerden geçmektir. Bu yöntemler çok yaygın olarak kullanılsalar bile sınırlamaları vardır: takma isimlendirme tersine mühendislik riski taşır, anonimleştirme çok önemliyse istismar edilebilirlik sorunu yaratır ama aynı zamanda diğer veri kaynaklarıyla kesişerek yeniden tanımlama risklerine neden olur, toplama, kullanımı sınırlar ve şaşırtma, bilginin kalitesini değiştirir.

Yapay zekanın farklı alanlarında (üretimde veri aktarımı, performans veya regresyonsuz testler için üretim öncesi, geliştirme veya kabul faaliyetlerini kolaylaştırmak için gerçek verilerin kullanılması vb.) çok uzun süre kullanılan bu çözümler, riski sınırlandırır, ancak bunların kullanımı çoğu zaman sömürülebilirlik ile yeniden tanımlama riski arasında doğru imleci bulmayı gerektirir. Bununla birlikte, bu çözümler geçmişte birçok kullanım senaryosunu tatmin edebildiyse, AI ve Bulutun ortaya çıkması ve artan veri sızıntısı riskindeki artış, kartları yeniden karıştırdı.

Sentetik veriler: yeni bir fırsat!

Genel olarak sentetik veriler, ölçüm süreçleri veya Bilgi Sistemlerinde (BS) gerçekleştirilen işlemler yoluyla elde edilmemiş verilerdir. Matematiksel yaklaşımlar, makine öğrenimi kullanılarak, bazen mevcut olandan türetilen veya matematiksel fonksiyonlarla tamamen simüle edilerek üretildiler. Sentetik veri oluşturmaya yönelik bu teknik, mevcut veriler üzerindeki kısıtlamaları gidermeyi mümkün kılabilir.

Örneğin, bilgisayarla görme gibi model eğitim süreci için kullanılacak etiketli verilerin eksikliği, farklı yüz türlerinin üst üste bindirildiği bilinen ve mevcut fotoğraflardan bireylerin fotoğraflarının üretilmesini mümkün kılar. maskeli ve maskesiz bireyleri tanımak.

Diğer bir örnek ise, dolandırıcılık tespitinde geçmiş verilerde referans vakaların olmaması, bu vakaların mevcut verilerde bulunmadığı gerçeğini gidermek için öngörülen hile vakalarının verilere enjekte edilmesine izin verir.

Otonom sürüş de sentetik veri üretme ihtiyacına çok iyi bir örnektir, çünkü algoritmaları mümkün olduğu kadar iyi eğitmek için gerçek hayatta tüm olası durumları üretebilmek düşünülemez.

Tüm bu durumlarda bu tekniklerin getirdiği kazanımlar gözlemlenmiş ve gösterilmiştir. Bu nedenle, hassas veriler için doğrudan bir uygulama bulmak oldukça doğaldır.

Neden bu teknikleri uygulamıyorsunuz ve sentetik veri oluşturma mekanizmaları sayesinde bir “ikiz” hassas veri üretmiyorsunuz ve böylece müşteriler veya çalışanlar için oluşturulmuş varlıklardan gerçek varlıkların yeniden yapılandırılmasının imkansızlığını garanti ediyorsunuz.

Gartner, 2024 yılına kadar yapay verilerin yapay zeka çözümleri geliştirmek için kullanılan verilerin %60’ını oluşturacağını tahmin ediyor. Gördüğümüz gibi, bir saldırı veya veri sızıntısı durumunda daha iyi güvence altına alınacak olan eğitim verilerinin kullanıcılar ve ayrıca şirketler yararına işlenmesinde gerçek bir devrimin başlangıcındayız.



genel-15