Anketler çok eski zamanlardan beri nüfus, ürünler ve kamuoyu hakkında bilgi edinmek için kullanılmıştır. Metodolojiler bin yıl boyunca değişmiş olsa da bir şey sabit kaldı: İnsanlara duyulan ihtiyaç, çok sayıda insana duyulan ihtiyaç.

Peki ya anlamlı sonuçlar elde etmek için yeterince büyük bir örnek grup oluşturmaya yetecek kadar insan bulamazsanız? Ya da potansiyel olarak yeterli sayıda insan bulabiliyorsanız ancak bütçe kısıtlamaları kaynak sağlayabileceğiniz ve röportaj yapabileceğiniz kişi sayısını sınırlıyorsa?

burası Fairgen yardım etmek istiyor. İsrailli girişim bugün, gerçeği kadar iyi olduğunu söylediği sentetik veriler üretmek için “istatistiksel yapay zeka”yı kullanan bir platform başlattı. Şirket ayrıca Maverick Ventures Israel, The Creator Fund, Tal Ventures, Ignia ve bir avuç melek yatırımcıdan 5,5 milyon dolarlık yeni bir bağış toplamayı da duyurdu ve başlangıçtan bu yana toplanan toplam nakdi 8 milyon dolara çıkardı.

“Sahte veriler”

Veriler şunlar olabilir: Yapay zekanın can damarıama aynı zamanda ezelden beri pazar araştırmasının da temel taşı olmuştur. Dolayısıyla Fairgen’in dünyasında olduğu gibi iki dünya çarpıştığında, kaliteli verilere olan ihtiyaç biraz daha belirgin hale geliyor.

2021 yılında İsrail’in Tel Aviv şehrinde kurulan Fairgen, daha önce şunlara odaklanmıştı: Yapay zekada önyargıyla mücadele. Ancak 2022’nin sonlarında şirket yeni bir ürüne geçiş yaptı. Adil artışşu anda beta sürümünden çıkıyor.

Fairboost, daha küçük bir veri kümesini üç kata kadar “artırmayı” vaat ederek, normalde ulaşılması çok zor veya pahalı olabilecek nişlere ilişkin daha ayrıntılı içgörülere olanak tanır. Bunu kullanarak şirketler, Fairgen platformuna yükledikleri her veri seti için farklı anket segmentlerindeki istatistiksel yapay zeka öğrenme modelleriyle derin bir makine öğrenme modeli eğitebilirler.

“Sentetik veri” kavramı (gerçek dünyadaki olaylardan ziyade yapay olarak oluşturulan veriler) yeni değildir. Kökleri, yazılım ve algoritmaları test etmek ve süreçleri simüle etmek için kullanıldığı bilgisayar biliminin ilk günlerine kadar uzanır. Ancak bugün anladığımız şekliyle sentetik veriler, özellikle modelleri eğitmek için giderek daha fazla kullanıldığı makine öğreniminin ortaya çıkışıyla birlikte kendi başına bir hayat kazandı. Hassas bilgiler içermeyen yapay olarak oluşturulmuş verileri kullanarak hem veri kıtlığı sorunlarını hem de veri gizliliği endişelerini giderebiliriz.

Fairgen, sentetik verileri teste tabi tutan en son girişimdir ve birincil hedefi pazar araştırmasıdır. Fairgen’in yoktan veri üretmediğini veya milyonlarca tarihsel araştırmayı yapay zeka destekli bir eritme potasına atmadığını belirtmekte fayda var; pazar araştırmacılarının hedef pazarlarının küçük bir örneği için bir anket yürütmeleri gerekiyor ve bundan yola çıkarak Fairgen Örneği genişletmek için modeller oluşturur. Şirket, orijinal numunede en az iki kat artış garanti edebileceğini, ancak ortalama olarak üç kat artış sağlayabileceğini söylüyor.

Bu şekilde Fairgen, belirli bir yaş grubundan ve/veya gelir düzeyinden birinin bir soruyu belirli bir şekilde yanıtlamaya daha yatkın olduğunu tespit edebilir. Veya orijinal veri kümesinden tahmin yapmak için istediğiniz sayıda veri noktasını birleştirin. Temel olarak Fairgen kurucu ortağı ve CEO’sunun yapabileceklerini yaratmakla ilgilidir. Samuel Cohen “Daha düşük hata payına sahip, daha güçlü, daha sağlam veri segmentleri” diyor.

Cohen, TechCrunch’a şöyle konuştu: “Asıl fark, insanların giderek daha fazla çeşitlilik kazandığıydı; markaların buna uyum sağlaması ve müşteri segmentlerini anlaması gerekiyor.” “Segmentler çok farklı; Z kuşağı yaşlı insanlardan farklı düşünüyor. Ve segment düzeyinde bu pazar anlayışına sahip olabilmek çok fazla paraya mal oluyor, çok fazla zaman ve operasyonel kaynak gerektiriyor. Ve acı noktasının burada olduğunu fark ettim. Sentetik verilerin bu konuda oynayacağı bir rol olduğunu biliyorduk.”

Şirketin de mücadele ettiğini kabul ettiği bariz bir eleştiri, tüm bunların sahaya çıkıp gerçek insanlarla röportaj yapmak ve gerçek görüşler toplamak zorunda kalmanın devasa bir kısayolu gibi görünmesidir.

Elbette az temsil edilen herhangi bir grup, gerçek seslerinin yerini sahte seslerin aldığından endişelenmeli mi?

Fairgen’in büyüme sorumlusu, “Araştırma alanında konuştuğumuz her müşterinin devasa kör noktaları, yani ulaşılması zor hedef kitleleri var”, dedi. Fernando ZatzTechCrunch’a söyledi. “Aslında proje satmıyorlar çünkü yeterli sayıda insan mevcut değil, özellikle de çok fazla pazar segmentasyonunun olduğu, giderek çeşitlenen bir dünyada. Bazen belirli ülkelere gidemiyorlar; belirli demografik özelliklere giremiyorlar, dolayısıyla kotalarına ulaşamadıkları için aslında projelerde kaybediyorlar. Minimum sayıları var [of respondents]ve bu sayıya ulaşmazlarsa analizleri satmazlar.”

Fairgen, üretken yapay zekayı pazar araştırması alanına uygulayan tek şirket değil. Qualtrics geçen yıl, üretken yapay zekayı platformuna getirmek için dört yılda 500 milyon dolar yatırım yaptığını açıklamıştı. nitel araştırmaya esaslı odaklanma. Ancak bu, sentetik verilerin burada ve burada kalacağının bir başka kanıtıdır.

Ancak sonuçların doğrulanması, insanları bunun gerçek anlaşma olduğuna ve optimal olmayan sonuçlar üretecek maliyet düşürücü bir önlem olmadığına ikna etmede önemli bir rol oynayacaktır. Fairgen bunu “gerçek” örnek güçlendirmeyi “sentetik” örnek güçlendirmeyle karşılaştırarak yapar; veri kümesinden küçük bir örnek alır, bunu tahmin eder ve onu gerçek şeyle yan yana koyar.

Cohen, “Kaydolduğumuz her müşteriyle aynı tür testi yapıyoruz” dedi.

İstatistiksel olarak konuşursak

Cohen’in Oxford Üniversitesi’nden istatistik bilimi alanında yüksek lisansı ve Londra’daki UCL’den makine öğrenimi alanında doktorası var; bunun bir kısmı Meta’da araştırma bilimcisi olarak dokuz aylık bir çalışmayı da içeriyor.

Şirketin kurucu ortaklarından biri başkandır Benny Schnaiderdaha önce kurumsal yazılım alanında yer alan ve adına dört çıkış bulunan: Ravello’dan Oracle’a 500 milyon dolar karşılığında 2016 yılında; Qumranet’ten Red Hat’ye 2008’de 107 milyon dolara; P-Cube’dan Cisco’ya için 200 milyon dolar 2004 yılında; ve Pentacom’dan Cisco’ya 2000 yılında 118 dolara.

Ve sonra var Emmanuel CandesFairgen’in baş bilimsel danışmanı olarak görev yapan Stanford Üniversitesi’nde istatistik ve elektrik mühendisliği profesörü.

Bu iş ve matematik omurgası, dünyayı sahte verilerin, eğer doğru uygulanırsa, gerçek veriler kadar iyi olabileceğine ikna etmeye çalışan bir şirket için önemli bir satış noktasıdır. Bu aynı zamanda teknolojisinin eşiklerini ve sınırlamalarını da bu şekilde açık bir şekilde açıklayabiliyorlar; optimum artışları elde etmek için numunelerin ne kadar büyük olması gerekiyor.

Cohen’e göre, bir anket için ideal olarak en az 300 gerçek yanıtlayıcıya ihtiyaç duyuyorlar ve bundan yola çıkarak Fairboost, daha geniş anketin %15’inden fazlasını oluşturmayacak bir segment boyutunu artırabilir.

Cohen, “Yüzde 15’in altında, yüzlerce paralel testle doğruladıktan sonra ortalama 3 kat artış garanti edebiliriz” dedi. “İstatistiksel olarak, kazançlar %15’in üzerinde daha az dramatik. Veriler hâlihazırda iyi bir güven düzeyi sunuyor ve sentetik yanıt verenlerimiz yalnızca potansiyel olarak bu değerlerle eşleşebilir veya marjinal bir artış sağlayabilir. İş açısından da %15’in üzerinde bir sıkıntı noktası yok; markalar zaten bu gruplardan bir şeyler öğrenebilir; yalnızca niş düzeyde sıkışıp kalmışlar.”

LLM olmaması faktörü

Fairgen’in büyük dil modelleri (LLM’ler) kullanmadığını ve platformunun ChatGPT tarzında “sade İngilizce” yanıtlar üretmediğini belirtmekte fayda var. Bunun nedeni, bir Yüksek Lisans eğitiminin, çalışmanın parametreleri dışında sayısız diğer veri kaynaklarından elde edilen öğrenmeleri kullanmasıdır; bu da nicel araştırmayla bağdaşmayan önyargının ortaya çıkma olasılığını artırır.

Fairgen tamamen istatistiksel modeller ve tablo halindeki verilerle ilgilidir ve eğitimi yalnızca yüklenen veri kümesinde yer alan verilere dayanır. Bu, pazar araştırmacılarının anketteki bitişik bölümlerden çıkarımlar yaparak yeni ve sentetik yanıtlayıcılar oluşturmasına etkili bir şekilde olanak tanır.

“Çok basit bir nedenden ötürü herhangi bir Yüksek Lisans eğitimi kullanmıyoruz; [other] Cohen, anketlerin yalnızca yanlış bilgi aktaracağını söyledi. “Çünkü başka bir ankette bir şeyler öğrenildiği durumlar olur ve biz bunu istemiyoruz. Her şey güvenilirlikle alakalı.”

İş modeli açısından Fairgen, şirketlerin anketlerini hangi yapılandırılmış formatta (.CSV veya .SAV) Fairgen’in bulut tabanlı platformuna yüklediği bir SaaS olarak satılmaktadır. Cohen’e göre, soru sayısına bağlı olarak modeli verilen anket verileriyle eğitmek 20 dakika kadar sürüyor. Kullanıcı daha sonra bir “segment” (belirli özellikleri paylaşan yanıt verenlerin bir alt kümesi) seçer – örneğin “X endüstrisinde çalışan Z Kuşağı” – ve ardından Fairgen, orijinal eğitim dosyasıyla aynı şekilde yapılandırılmış, tamamen aynı soruları içeren yeni bir dosya sunar. , yalnızca yeni satırlar.

Fairgen tarafından kullanılıyor BVA ve Fransız anket ve pazar araştırma firması IFOP, girişimin teknolojisini zaten hizmetlerine entegre etmiş durumda. IFOP, biraz benziyor Gallup ABD’de Fairgen, Avrupa seçimlerinde anket amacıyla kullanılıyor ancak Cohen, bu yılın sonlarında ABD seçimlerinde de kullanılmaya başlanabileceğini düşünüyor.

Cohen, “IFOP temelde bizim onay damgamızdır çünkü yaklaşık 100 yıldır ortalıktalar” dedi. “Teknolojiyi onayladılar ve orijinal tasarım ortağımız oldular. Ayrıca, henüz hakkında konuşmama izin verilmeyen, dünyanın en büyük pazar araştırma şirketlerinden bazılarını test ediyoruz veya halihazırda onlarla entegre oluyoruz.”



genel-24