Bir yıldan kısa bir süre önce, Anthropic, AI’yı daha güvenilir ve açıklanabilir hale getirmek için kamu yararına araştırma yapmak amacıyla eski OpenAI araştırma başkan yardımcısı Dario Amodei tarafından kuruldu. 124 milyon dolarlık fon o zaman şaşırtıcıydı, ancak hiçbir şey bizi şirkete hazırlayamazdı. 580 milyon dolar topladı bir yıldan az bir süre sonra.

Amodei duyuruda, “Bu bağış toplama ile, makine öğrenimi sistemlerinin öngörülebilir ölçeklendirme özelliklerini keşfederken, yeteneklerin ve güvenlik sorunlarının geniş ölçekte ortaya çıkabileceği öngörülemeyen yolları yakından inceleyeceğiz” dedi.

Birlikte kamu yararına şirketin kurucu ortağı olduğu kız kardeşi Daniela, şirketi kurduktan sonra şunları söyledi: “Antropik’in, ölçeklenirken sorumlu bir şekilde güvenli AI sistemlerini keşfetmeye ve geliştirmeye devam edecek kültüre ve yönetişime sahip olmasını sağlamaya odaklanıyoruz. ”

Yine o kelime var – ölçek. Çünkü sorun kategorisi bu, Antropik’i incelemek için oluşturuldu: mantıklarını ve sonuçlarını açıklama yeteneğimizin ötesinde büyüdükçe her sektörde giderek artan bir şekilde kullanılan AI modellerini nasıl daha iyi anlayabiliriz.

Şirket, örneğin, yaptıkları sonuçları neden ve nasıl ürettiklerini anlamak için dil modellerinin davranışını tersine mühendislikle inceleyen birkaç makale yayınladı. Muhtemelen en iyi bilinen dil modeli olan GPT-3 gibi bir şey inkar edilemez derecede etkileyicidir, ancak dahili işlemlerinin yaratıcıları için bile esasen bir gizem olduğu gerçeği konusunda endişe verici bir şey var.

Yeni finansman duyurusunun açıkladığı gibi:

Bu araştırmanın amacı, daha iyi örtülü güvencelere sahip ve daha az eğitim sonrası müdahale gerektiren büyük ölçekli modeller oluşturmak için gerekli teknik bileşenleri geliştirmek ve aynı zamanda bu modellerin içine daha fazla bakmak için gerekli araçları geliştirmektir. korumalar gerçekten işe yarıyor.

Bir AI sisteminin nasıl çalıştığını anlamıyorsanız, yalnızca yanlış bir şey yaptığında tepki verebilirsiniz – örneğin, yüzleri tanımada önyargı sergiliyor veya doktorlar ve CEO’lar hakkında soru sorulduğunda erkekleri çizme veya tanımlama eğilimi gösteriyor. Bu davranış modele dahil edilmiştir ve çözüm, ilk etapta bu yanlış “kavramlara” sahip olmasını engellemek yerine çıktılarını filtrelemektir.

Yapay zekanın nasıl oluşturulduğu ve anlaşıldığı konusunda bir tür temel değişiklik ve bu nedenle büyük beyinler ve büyük bilgisayarlar gerektirir – ikisi de özellikle ucuz değildir. 124 milyon doların iyi bir başlangıç ​​olduğuna şüphe yok, ancak görünüşe göre erken sonuçlar, Sam Bankman-Fried’in Caroline Ellison, Jim McClave, Nishad Singh, Jaan Tallinn ve Gelişen Risk Araştırmaları Merkezi’nin katıldığı bu muazzam yeni tura liderlik etmesi için yeterince umut vericiydi. .

Bu grupta her zamanki derin teknoloji yatırımcılarından hiçbirini görmek ilginç değil – ama elbette Anthropic, VC’ler için bir tür anlaşma kırıcı olan bir kâr elde etmeyi amaçlamıyor.

Anthropic’in en son araştırmalarını buradan takip edebilirsiniz.



genel-24