Büyük Veri’lerin oluşmasıyla bilim çevreleri Büyük Veri’nin karakteristik özelliklerini tanımlamak amacıyla belli özellikler belirlemişlerdir. Konuyla ilgili olarak ilk çalışma yapanlardan Doug Laney 2001 yılındaki raporunda Büyük Veri’yi 3V olarak sınıflandırmıştır. Devam eden çalışmalar sonucunda genel olarak beş boyut üzerinden incelenen Büyük Veri’ler 5V olarak sınıflandırmış, ancak 7V, 11V, 40V olarak boyutlandırma yapan bilim insanları da olmuştur. Bu yazımızda 5V
Volume (Büyüklük), Variety (Yapı), Velocity (Hız), Value (Değer), Veracity (Güvenilirlik) olarak Büyük Veri’nin karakteristik özellikleri incelenmiştir.

1. Volume (Büyüklük)

Veri büyüklüğünün bit/byte cinsinden büyüklüğünü ifade etmektedir. Örneğin Büyük Veri’nin önceleri dağıtık mimari sistemde 300 terabayt gibi ifade edilirken günümüzde petabyte, exabyte, zetabyte’lardan söz edilmektedir. 1 zetabyte bir trilyon gigabyte veya 1 milyar terabyte anlamına gelmektedir. Wallmart şirketi müşterilerinin yapmış olduğu bir saatlik alışveriş hareketi sonucunda 2.5 petabyte veri işlemekte ve bu veri her geçen gün artmaktadır. Google şirketi ise günde 24 petabyte veri ile işlem yapmaktadır. 2009 yılında dünya genelinde veri miktarı 0.8 zetabyte iken 2021 yılı sonunda 6.4 zetabyte olacağı değerlendirilmektedir.

2. Variety (Veri Çeşitliliği)

Veri çeşitliliği, Büyük Veri içindeki farklı eleman tiplerinin ifade etmektedir. Akıllı telefonlar gibi mobil cihazların üretmiş oldukları çeşitli türden veriler olabilmektedir. Örneğin ses, video veya multimedya verileri, metin verileri, konum verileri gibi. Veri tipleri yapısal ve yapısal olmayan olarak ikiye ayrılmıştır. Geleneksel yapıdaki örneğin SQL gibi olan veri tiplerine yapılandırılmış olarak ifade edilirken, yukarıda bahsedildiği gibi örnek olarak mobil cihazların üretmiş oldukları farklı türden veriler yapılandırılmamış olarak kabul edilir. Veri çeşitliliği Volume’den (büyüklük) sonra sorun oluşturabilecek özellikler arasında yer almaktadır. Çünkü Volume’de olduğu gibi geleneksel yöntemlerle verinin çeşitli olması da Büyük Veri’nin işlenmesini engel olmaktadır.

3. Velocity (Hız)

Büyük Veri’nin büyüme hızını ifade etmektedir. Özellikle IoT cihazlarının sayısı artmasıyla Büyük Veri’nin büyüme hızıda artmaktadır. 2015 yılında IoT cihazları 15 milyarken 2020 yılı sonunda bu sayının 30 milyarı aşması düşünülmektedir. RFID cihazlarının sayısının artmasıyla ve bu sistemlerin internet ortamına çıkış yapması da Büyük Veri’nin oluşma hızını arttırmıştır. Zaman ilerledikçe internet kullanımı daha da artacak ve Büyük Veri’lerin oluşma hızı da büyüyecektir.

4. Value (Değer)

Büyük Veri’lerin işlenmesi sonucunda elde edilen tutarlı verilerin analiz edilerek, kişiler veya kurumlar için değerli bir hale getirilmesidir. Büyük Veri’nin en önemli bileşenlerinden kabul edilmektedir. Bu denli karmaşık, hızlı, çeşitli, yönetilmesi işlenmesi zor veriler, kişiler veya kurumlar için fayda sağlamalıdır. Söz gelimi bu veriler sayesinde kritik noktalarda doğru kararlar alınabilmelidir. Örneğin müşterisine kredi verecek olan bir banka, müşterisi hakkındaki verileri anında değerlendirip müşterisine olumlu veya olumsuz cevap verebilmelidir.

5. Veracity (Güvenilirlik)

Toplanan verinin güvenilir ve anlamlı olması demektir. Her toplanan veri, Büyük Veri olarak kişilere ve kurumlara fayda sağlaması beklenemez. Bunun için gerekli analizler yapılarak veri güvenirliği test edilmedilir. Veri toplanırken Büyük Veri’ye uygun teknoloji kanalları ile toplanması daha doğru olacaktır. Her veri bilgiye dönüşecek diye düşünülmemelidir.

Bir cevap yazın