HADOOP Nedir? Tarihsel Gelişimi ve Arama Motorları

Büyük verilerin oluşmasıyla beraber, verilerin işlenmesi, kullanılması, depolanması, güvenirliği gibi temel sorunlar oluşmaya başlamıştı. Özellikle devasa veriler bulunduran arama motorları buna bir çözüm bulmak zorunda kalmışlardı. Google ilk olarak 2003 yılında kendi içerisinde oluşturmuş olduğu dağıtık mimarideki dosya sistemi olan GFS’yi (Google File System – Google Dosyalama Sistemi) duyurdu daha sonra veriler üzerinde uyguladığı yöntem olan MapReduce programlama modelini açıklayan çalışmasını yayınladı. Çalışmanın yayınlanmasıyla birlikte bilim çevreleri tarafından da takip edilen gelişmeler, özellikle dosyalama sisteminin dağıtık olması ve üzerinde MapReduce ile işlemlerin yapılmasının, büyük verilerle gelen sorunların çözümü açısından önemli bir gelişme olarak görüldü.

Doug Cutting’in ve Arkadaşlarının Katkısı

Yılların geçmesiyle beraber gelişmeleri takip eden Doug Cutting ve arkadaşları dağıtık dosyalama sistemini ve MapReduce uygulamasını Nutch adındaki arama motorunda kullanarak üst seviyede bir performans elde ettiler. Açık kaynak kodlu bu projeye HADOOP ismi verildi. Nucth arama motoru ve yeni geliştirilmiş olan HADOOP kütüphanesi Apache çatısı altında buluşmuştu. Diğer yandan GFS ismi de HADOOP isminin oluşmasıyla HDFS (Hadoop Distributed File System – Hadoop Dağıtık Dosyalama Sistemi) olarak değiştirildi.

Google X Yahoo

2006 yılında Doug Cutting’in Yahoo firmasıyla anlaşarak HADOOP projesinin ilk uygulamalarından birini, Yahoo sitesinde arama motoru oluşturarak gerçekleştirmiş oldu. Bu gelişmeyle beraber aynı zamanda arama motoru camiasında Yahoo ve Google rakip haline geldi.

HADOOP Çağına göre üst segmentte olmayan bilgisayarlar ile Cluster’lar (küme) oluşturarak, çok daha maliyetli ve yüksek özellikli bilgisayarlardan daha iyi performans sağlamaktaydı. Bu da Yahoo ve Google için en önemli tercih sebebi olmuştu.

İlk zamanlar sadece arama motorları ve veri barındıran büyük firmalar tarafından kullanılan HADOOP. Büyük verinin de yaygınlaşmasıyla günümüzde oldukça yaygın kullanılan bir proje haline gelmiştir.

HADOOP Cluster’ları eşzamanlı ve paralel çalışan yatay bir mimariden oluşmaktadır. İhtiyaç halinde yine üst segment olmayan maliyeti az olan bilgisayarlar ilave edilerek güçlendirilebilirler.

HADOOP-1 ve HADOOP-2 Temel Bileşenleri

HADOOP ilk ortaya çıkıp proje haline geldiğinde temel olarak 2 bileşenden oluşmaktaydı. HDFS ve MapReduce. Proje bu haliyle HADOOP-1 olarak anılmaktadır. HADOOP-1’de kaynak erişimi, verilerin işlenmesi, sonuçlarının çıkarılması gibi tüm işlemler MapReduce ile yapılmaktaydı. Daha sonra yine Apache yazılımcıları tarafından geliştirilen açık kaynak kodlu olan YARN uygulaması kaynak yönetimini MapReduce üzerinden alarak HADOOP’un performansını çok daha iyi duruma getirdi. YARN’ın geliştirilmesi ve projeye dahil edilmesi HADOOP-2 olarak isimlendirilmiştir.

HADOOP Nedir? Tarihsel Gelişimi ve Arama Motorları

Byteknomers

Doug Cutting’in ve Arkadaşlarının Katkısı

Google X Yahoo

HADOOP-1 ve HADOOP-2 Temel Bileşenleri

By teknomers

Benzer İçerikler

ERP ve MRP Yazılımları Nedir? Ne İşe Yarar?

UPDF : Entegre PDF Yazılımı Adobe’yi Geride Bırakan Yapay Zeka Özellikli Program

Dijital Pazarlama Stratejilerinizi Güçlendirmek İçin Dopinger SEO Hizmeti Nasıl Kullanılır?

Bir yanıt yazın Yanıtı iptal et

En hızlı oyun SSD’sinin fiyatı 155 dolara düştü

JD aktörünün büyük bir tanıtım yapmasıyla Gears of War 6 nihayet yakında gelebilir

Çökme Sorunlarını Düzeltmek İçin PUBG 2.61 Güncellemesi 25 Nisan’da Çıktı

Yeni roguelike oyun Steam’e çıktığında 1920’lerin en büyük kaçakçısı olun

Amazon’da orta sınıf Galaxy Tab S9 FE+’ta büyük indirimler yapmak için henüz çok geç değil

Reddit’in iOS ve Android uygulama güncellemesi, kullanıcıları sohbete yönlendiriyor

Söylentilere göre 12,9 inç iPad Air’de mini LED ekran yok: LCD’nin kalacağı söyleniyor

Endişelenmeyin, Galaxy Z Flip 6’nın hâlâ Snapdragon 8 Gen 3 çipi (ve 8 GB RAM) taşıması garanti ediliyor

NASA gezgini Mars’ta fosilleşmiş yaşam aramak için umut verici bir yere ulaştı

2024 Tam Güneş Tutulması’ndan Çığır Açan Bulgular

Uzay görevi konseptleri için kilovat altı elektrikli tahrik teknolojisinin sınırlarını zorlamak

Diğer Dünyalarda Su Avı

İlginizi Çekebilir

Samsung, dünyanın en kalabalık beşinci ülkesinde Galaxy S24 talebini karşılamakta zorlanıyor

Hubble, Küçük Halter Bulutsusu’nun Muhteşem Görünümüyle 34. Yıldönümünü Kutluyor

Clash of Clans geliştiricisi Supercell’in bir sonraki büyük oyunu Mayıs’ta çıkıyor

Asus ROG Ally şimdiye kadarki en önemli güncellemesini aldı: oyunların çok daha hızlı çalışmasını sağlayacak ücretsiz bir destek