Yapay zeka sektöründe geçtiğimiz yıl hızlı mühendislik popüler bir iş haline geldi, ancak Anthropic’in bunu en azından kısmen otomatikleştirecek araçlar geliştirdiği anlaşılıyor.

Anthropic, geliştiricilerin girişimin dil modeliyle daha kullanışlı uygulamalar oluşturmasına yardımcı olmak için Salı günü birkaç yeni özellik yayınladı, Claude’a göre şirket blog yazısıGeliştiriciler artık Claude 3.5 Sonnet’i kullanarak istemleri oluşturabilir, test edebilir ve değerlendirebilir, istem mühendisliği tekniklerini kullanarak daha iyi girdiler oluşturabilir ve Claude’un özel görevler için verdiği yanıtları iyileştirebilir.

Dil modelleri, bazı görevleri gerçekleştirmelerini istediğinizde oldukça affedicidir, ancak bazen bir istemin ifadesinde yapılan küçük değişiklikler sonuçlarda büyük iyileştirmelere yol açabilir. Normalde bu ifadeyi kendiniz bulmanız veya bunu yapması için bir istem mühendisi tutmanız gerekir, ancak bu yeni özellik iyileştirmeleri bulmayı kolaylaştırabilecek hızlı geri bildirimler sunar.

Özellikler, yeni bir Değerlendirme sekmesi altında Anthropic Konsolu’nda yer almaktadır. Konsol, Claude ile ürün geliştirmek isteyen işletmeleri çekmek için oluşturulan, geliştiriciler için girişimin test mutfağıdır. Mayıs ayında açıklanan özelliklerden biri, Anthropic’in yerleşik istem oluşturucusudur; bu, bir görevin kısa bir tanımını alır ve Anthropic’in kendi istem mühendisliği tekniklerini kullanarak çok daha uzun, ayrıntılı bir istem oluşturur. Anthropic’in araçları, istem mühendislerinin yerini tamamen almasa da, şirket bunun yeni kullanıcılara yardımcı olacağını ve deneyimli istem mühendisleri için zaman kazandıracağını söyledi.

Evaluate’te geliştiriciler, AI uygulamalarının istemlerinin çeşitli senaryolarda ne kadar etkili olduğunu test edebilir. Geliştiriciler, gerçek dünya örneklerini bir test takımına yükleyebilir veya Claude’dan AI tarafından oluşturulan bir dizi test vakası oluşturmasını isteyebilir. Geliştiriciler daha sonra çeşitli istemlerin ne kadar etkili olduğunu yan yana karşılaştırabilir ve örnek cevapları beş puanlık bir ölçekte derecelendirebilir.

Üretilen verilerle beslenen bir istem, iyi ve kötü yanıtları bulur.
Resim Kredileri: Antropik

Anthropic’in blog yazısından bir örnekte, bir geliştirici uygulamasının birkaç test vakasında çok kısa cevaplar verdiğini tespit etti. Geliştirici, cevapları daha uzun hale getirmek için istemindeki bir satırı ayarlayabildi ve bunu aynı anda tüm test vakalarına uygulayabildi. Bu, özellikle az veya hiç istem mühendisliği deneyimi olmayan geliştiricilere çok fazla zaman ve emek kazandırabilir.

Anthropic CEO’su ve kurucu ortağı Dario Amodei, hızlı mühendisliğin, üretken yapay zekanın yaygın bir şekilde kurumsal olarak benimsenmesi için en önemli şeylerden biri olduğunu söyledi. röportaj Google Cloud Next’ten bu yılın başlarında. “Basit geliyor, ancak hızlı bir mühendisle 30 dakika geçirmek, daha önce çalışmadığı bir uygulamayı çalıştırabilir,” dedi Amodei.



genel-24