Yapay zeka ve onlara güç veren büyük dil modelleri (LLM’ler) bir ton yararlı uygulamaya sahiptir, ancak tüm vaatleri için çok güvenilir değildirler.
Kimse bu sorunun ne zaman çözüleceğini bilmiyor, bu nedenle girişimlerin işletmelerin iş için ödeme yaptıkları LLM destekli uygulamaların amaçlandığı gibi emin olmasına yardımcı olmak için bir fırsat bulduğunu görüyoruz.
Londra merkezli girişim Composo İşletmelerin LLM’ler tarafından desteklenen uygulamaların doğruluğunu ve kalitesini değerlendirmesine yardımcı olabilecek özel modelleri sayesinde bu sorunu çözmeye çalışırken bir başlığı olduğunu düşünüyor.
Şirket benzer AjanFreeplay, İnsanlık Ve Langsmithtüm insan testlerine, kontrol listelerine ve mevcut gözlemlenebilirlik araçlarına daha sağlam, LLM tabanlı bir alternatif sunduğunu iddia ediyor. Ancak Composo, hem kodsuz bir seçenek hem de API sunduğundan farklı olduğunu iddia ediyor. Bu dikkate değer çünkü bu potansiyel pazarının kapsamını genişletiyor – onu kullanmak için bir geliştirici olmanıza gerek yok ve alan uzmanları ve yöneticileri AI uygulamalarını tutarsızlıklar, kalite ve doğruluk açısından değerlendirebilir.
Uygulamada, composo birleştirir Bir kişinin, uygulamadan çıktıları bu kriterlere göre değerlendiren bir sistem oluşturmak için, bu uygulamaya özgü tanımlanmış bir kriter seti ile bir AI uygulamasından görmeyi tercih edeceği çıktı üzerinde eğitilmiş bir ödül modeli. Örneğin, bir tıbbi triyaj chatbot, istemcisinin kırmızı bayrak belirtilerini kontrol etmek için özel yönergeleri oluşturabilir ve Composo uygulamanın ne kadar tutarlı bir şekilde puan verebilir.
Son zamanlarda şirket bir kamu API’sını başlattı Composo Hizalama için, LLM uygulamalarını herhangi bir kriter üzerinde değerlendirmek için bir model.
Strateji bir şekilde çalışıyor gibi görünüyor: Müşteri tabanında Accenture, Palantir ve McKinsey gibi isimleri var ve son zamanlarda 2 milyon dolarlık fonu topladı. Burada ortaya konan az miktar, bugünün girişim ikliminde bir başlangıç için nadir değildir, ancak bu, bu şirketlere finansman boldur, çünkü bu AI arazisidir.
Ancak Composo’nun kurucu ortağı ve CEO’su Sebastian Fox’a göre, nispeten düşük sayı, girişimin yaklaşımının özellikle sermaye yoğun olmamasıdır.
Eski bir McKinsey danışmanı olan Fox, “En azından önümüzdeki üç yıl boyunca, yüz milyonlarca yetiştirmeyi kendimizi öngörmüyoruz çünkü temel modeller oluşturan ve bunu çok etkili bir şekilde yapan birçok insan var ve bu bizim USP’miz değil” dedi. “Bunun yerine, her sabah uyanır ve Openai’nin modellerinde büyük bir ilerleme kaydettiği bir haber parçası görürsem, bu benim işim için iyidir.”
Taze nakit ile Composo, mühendislik ekibini (kurucu ortağı ve GraphCore’da eski bir makine öğrenme mühendisi olan CTO Luke Markham tarafından yönetilen) genişletmeyi planlıyor, daha fazla müşteri ediniyor ve Ar-Ge çabalarını destekliyor. Fox, “Bu yılın odak noktası, şu anda bu şirketler arasında sahip olduğumuz teknolojiyi ölçeklendirmekle ilgili” dedi.
İngiliz AI Ön Tohum Fonu İkiz Yol Girişimleri tohum turunu da yönetti, bu da JVH Ventures Ve Ewor (İkincisi, şirketi hızlandırıcı programı aracılığıyla desteklemişti). İkiz Yol sözcüsü yaptığı açıklamada, “Composo, Enterprise AI’nın benimsenmesinde kritik bir darboğaz ele alıyor.” Dedi.
Fox, bu darboğazın genel AI hareketi için, özellikle kurumsal segmentte büyük bir sorun olduğunu söyledi. “İnsanlar heyecanın yutturmacası üzerinde ve şimdi düşünüyorlar, ‘Aslında, bu benim işimle ilgili bir şeyleri şu anki haliyle değiştiriyor mu? Çünkü yeterince güvenilir değil ve yeterince tutarlı değil. Ve öyle olsa bile, bana ne kadar olduğunu kanıtlayamazsınız ” dedi.
Bu darboğaz, Composo’yu AI uygulamak isteyen ancak bunu yapmaktan itibar riskine maruz kalabilecek şirketler için daha değerli hale getirebilir. Fox, şirketinin endüstri agnostik olmayı seçtiğini, ancak yine de uyum, yasal, sağlık ve güvenlik alanlarında rezonansa sahip olduğunu söylüyor.
Rekabetçi hendek gelince, Fox, buraya gelmek için gereken Ar -Ge’nin önemsiz olmadığını düşünüyor. “Hem modelin mimarisi hem de onu eğitmek için kullandığımız veriler var,” dedi CompoSo Hizginin “uzman değerlendirmelerin büyük bir veri kümesi” üzerinde eğitildiğini açıkladı.
Teknoloji devlerinin bu soruna girmek için büyük savaş sandıklarına dokunmaları durumunda ne yapabileceği sorusu var, ancak Composo ilk hamle avantajına sahip olduğunu düşünüyor. “Diğer [thing] zaman içinde tahakkuk ettiğimiz veriler, ”dedi Fox, Composo’nun değerlendirme tercihlerini nasıl oluşturduğuna atıfta bulundu.
Uygulamaları esnek bir kriter kümesine karşı değerlendirdiğinden, Composo da kendisini daha kısıtlı bir yaklaşım kullanan rakiplerden daha iyi AI’nin yükselişine daha uygun görüyor. Fox, “Bence, kesinlikle ajanların iyi çalıştığı aşamada değiliz ve aslında çözülmeye çalıştığımız şey bu” dedi.

