Microsoft, üretim çeviri modellerinin kalitesini önemli ölçüde artıran yeni bir AI teknolojisini benimseyerek çeviri yazılımına ve hizmetlerine büyük bir destek verdi.
Yazılım devi, sonunda, daha büyük XYZ kodu girişimi aracılığıyla metin, görüntü, ses ve dil için AI modellerini birleştirmeyi hedefliyor. Bu girişimin bir parçası olarak Z-code, konuşma, görme, duyma ve anlama yeteneğine sahip yapay zeka sistemlerinin oluşturulmasını destekler.
Microsoft, Microsoft Translator yazılımını ve diğer Azure AI hizmetlerini yeni Z kodu modelleriyle güncelledi. Bu modelleri üretime almak için yazılım devi, bunları verimli bir şekilde ölçeklendirmek ve dağıtmak için Nvidia GPU’ları ve Triton Inference Server’ı kullanıyor.
Ayrıca, Microsoft Translator’ın müşteriler için Z-code Mixture of Experts modellerini canlı olarak tanıtan ilk makine çevirisi sağlayıcısı olduğunu da belirtmekte fayda var.
Uzmanların Z-kodu Karışımı
Önceki AI modellerinden farklı olarak, Z kodu modelleri, modellerin farklı bölümlerinin farklı görevleri öğrenebileceği Uzmanlar Karışımı (MoE) adlı yeni bir mimari kullanır. Bu nedenle, modeller aynı anda birden çok dil arasında çeviri yapmayı öğrenir.
Aynı zamanda, yeni tanıtılan Z-kodu MoE modelleri, İngilizce ve Fransızca gibi benzer diller arasında verimli bilgi paylaşımını sağlayan transfer öğreniminden yararlanır. Modeller ayrıca eğitim sürecinde hem paralel hem de tek dilli verileri kullanır ve bu da yüksek kaynaklı dillerin ötesinde yüksek kaliteli makine çevirisine olanak tanır.
Geçen yılın Ekim ayında Microsoft, bir Blog yazısı Microsoft Translator’ın artık 100’den fazla dili çevirebildiğini. Bunu yapmak için şirket, 100 dil çiftini destekleyen 200 milyar parametre kullandı. Bununla birlikte, milyarlarca parametreye sahip büyük modelleri eğitmek zor olduğundan, Translator ekibi, Microsoft DeepSpeed ile birlikte çalışarak, büyük ölçekli Z kodu MoE modellerini eğitmeye yardımcı olmak için kullandığı yüksek performanslı bir sistem geliştirdi.
Microsoft daha sonra yeni Z-kodu/MoE modellerini GPU’lara dağıtmak için çalışma zamanında kullanılabilecek daha hızlı motorları optimize etmek için Nvidia ile ortaklık kurdu. Nvidia, MoE katmanlarını tek bir V100 GPU’da uygulamak için CUTLASS ve FasterTransformer kitaplıklarından yararlanan özel CUDA çekirdekleri geliştirdi.
Microsoft’un yeni Z-kodu modelleri, orijinal biçimlendirmelerini koruyarak tüm belgeleri ve hatta ciltlerce belgeleri çeşitli farklı dosya biçimlerine çeviren Belge Çevirisi özelliğini kullanan müşteriler artık davetli olarak kullanılabilir.