Leibniz Potsdam Astrofizik Enstitüsü’nden (AIP) ve Barselona Üniversitesi Uzay Bilimleri Enstitüsü’nden (ICCUB) bilim adamları, Gaia misyonu tarafından gözlemlenen 217 milyon yıldızdan elde edilen verilerin verimli bir şekilde işlenmesi için yeni bir makine öğrenimi modeli sundular. Bu yaklaşım, yıldızların özelliklerini haritalamak ve Samanyolu’nun yapısına ilişkin anlayışımızı geliştirmek için yeni olanaklar sunuyor.
Avrupa Uzay Ajansı’nın Gaia uzay misyonundan elde edilen verilerin üçüncü sürümü, gökbilimcilere Samanyolu’nun keşfi için muazzam miktarda veriyi temsil eden 1,8 milyar yıldızın gelişmiş ölçümlerine erişim sağladı. Ancak bu kadar büyük bir veri setinin verimli bir şekilde analiz edilmesi büyük bir zorluk teşkil etmektedir. Araştırmada bilim insanları, Gaia gözlemevi tarafından sağlanan spektrofotometrik verileri kullanarak yıldızların temel özelliklerini tahmin etmek için makine öğreniminin kullanımını araştırdı.
Model, 8 milyon yıldıza ilişkin veriler üzerinde eğitildi ve küçük belirsizliklerle güvenilir tahminler elde etti. Çalışma Astronomi ve Astrofizik dergisinde yayınlandı.
“Aşırı gradyanla güçlendirilmiş ağaçlar olarak adlandırılan temel teknoloji, yıldızların sıcaklık, kimyasal bileşim ve yıldızlararası tozun gölgelemesi gibi kesin özelliklerini benzeri görülmemiş bir verimlilikle tahmin etmeyi mümkün kılıyor. Geliştirilen SHBoost makine öğrenimi modeli, model eğitimi ve tahmin dahil görevlerini tek GPU üzerinde dört saat içerisinde gerçekleştiriyor. Bu süreç daha önce iki hafta ve 3.000 yüksek performanslı işlemci gerektiriyordu” diyor AIP’den ve çalışmanın baş yazarı Arman Khalatyan.
Bu makine öğrenimi yöntemi hesaplama süresini, enerji tüketimini ve CO2 emisyonlarını önemli ölçüde azaltır. Bu yöntem ilk kez her türden yıldıza aynı anda başarıyla uygulandı.
Model, daha küçük araştırmalardan elde edilen yüksek kaliteli spektroskopik veriler üzerinde eğitilir ve daha sonra bu “bilgiyi” Gaia’nın üçüncü büyük veri sürümüne (DR3) uygulayarak, yalnızca fotometrik ve astrometrik verilerin yanı sıra düşük çözünürlüklü Gaia XP spektrumlarını kullanarak önemli parametreleri çıkarır.
“Sonuçların yüksek kalitesi, nadir metallerin düşük veya yüksek bolluğuna sahip yıldızlar gibi daha ileri çalışmalar için iyi adaylar ararken, kaynak yoğun spektroskopik gözlemlere olan ihtiyacı azaltır; bunlar, oluşumunun en erken aşamalarını anlamanın anahtarıdır. Samanyolu,” diyor AIP’den Cristina Chiappini.
Bu tekniğin, Şili’deki Avrupa Güney Gözlemevi’ndeki (ESO) 4MOST projesinin bir parçası olacak, Galaktik disk ve çıkıntıya ilişkin geniş ölçekli bir çalışma olan 4MIDABLE-LR gibi çok amaçlı spektroskopiyi kullanarak gelecekteki gözlemleri hazırlamak için hayati önem taşıdığı kanıtlanıyor. .
“Yeni yaklaşım, Samanyolu’nun genel kimyasal bileşiminin kapsamlı haritalarını sunarak genç ve yaşlı yıldızların dağılımını doğruluyor. Veriler, çubuk ve çıkıntı da dahil olmak üzere galaksinin iç bölgelerinde muazzam bir istatistiksel güce sahip, metal açısından zengin yıldızların yoğunlaştığını gösteriyor” diye ekliyor ICCUB’dan Friedrich Anders.
Ekip ayrıca modeli galaksideki genç, büyük, sıcak yıldızların haritasını çıkarmak için de kullandı; yıldızların oluştuğu uzak, tam olarak anlaşılamayan bölgeleri vurguladı. Veriler ayrıca Samanyolu’nda çok az genç yıldızın bulunduğu çok sayıda “boşluk” bulunduğunu da gösteriyor. Ek olarak veriler, yıldızlararası tozun üç boyutlu dağılımının hala tam olarak çözülemediği yerleri gösteriyor.
Gaia veri toplamaya devam ederken, makine öğrenimi modellerinin büyük veri kümelerini hızlı ve sağlam bir şekilde işleme yeteneği, onları gelecekteki astronomik araştırmalar için kritik bir araç haline getiriyor. Yaklaşımın başarısı, makine öğreniminin astronomi ve diğer bilimsel alanlardaki büyük veri analitiğini dönüştürürken daha sürdürülebilir araştırma uygulamalarını teşvik etme potansiyelini ortaya koyuyor.