Sonuçlar: Claude, NotebeLm ve Chatgpt ile cevap verdi Str_squish ()doğru cevabı düşünüyorum. Şaşkınlık, sadece boşluk için önem verdiğimi varsaydı Başlangıç ve Son metnin ortasında değil. Bir takip sorusundan sonra, en iyi işlevi de buldu.
Test 2: Sosyal medya yayınlarımın biraz belirsiz arama
Bu daha zor bir işti, ama insanların gerçek dünyada yardım isteyebileceğine benzer bir şeydi.
Soru: “Lucas Mearian tarafından ComputerWorld’de yazılan LLM’ler hakkında bir makaleyi gerçekten beğendim. Lütfen bana yüklediğim LinkedIn yayınlarıma dayanarak ayrıntılarını söyleyin.”
Bilgi Kaynağı: LinkedIn yayınlarımın 2 yılı.
Sonuçlar: NotebeLm ve Claude yanıtlarını çivilediler, her biri istediğim de dahil olmak üzere iki seçenek sunuyorlar. Chatgpt bana biraz ilgili makaleler verdi, ama istediğim makaleler değil. (“LLM’ler nelerdir ve üretken AI’da nasıl kullanılırlar?”)
Varsayılan Auto LLM ile şaşkınlık bana yararlı bir şey vermedi, “Lucas Mearian tarafından yazılmış büyük dil modelleri (LLMS) hakkında bir makaleden bahsetmiyor.”
Test 3: Belirli bir konu için bir ABD nüfus sayımı tablosu kimliği bulun
Birçok işletme, demografik bilgiler için ABD Nüfus Sayım Bürosu’nun Amerikan Toplum Araştırması’nı (ACS) kullanıyor. Binlerce mevcut veri değişkeni ile, istediğiniz bilgilere sahip olanı bulmak zor olabilir. Bu tür bir sorgu, işletmelerin kendi verileriyle yapmak isteyebileceği birçok veri aramasını temsil edebilir.
Soru: “Evden çalışan işçilerin yüzdesi hakkında bilgi bulmak için kullanılacak en iyi değişken nedir?”
Bilgi Kaynağı: Sayım Bürosu web sitesinden ACS tablolarının genel bir açıklaması ile birlikte ACS tablo değişken kimliklerinin birkaç listesini indirdim ve filtreledim (birkaç liste çok büyük olduğu için filtrelendim). Bu platformlardan bazıları projelerde CSV dosyalarını kabul etmediğinden, değişken verileri sekme-delimited .txt dosyaları olarak kaydettim.
Beklenen yanıt: Texas Christian Üniversitesi Kentsel Araştırmalar Merkezi Direktörü ve Tidycensus R Paketinin yazarı Kyle Walker, örneklerinden birinde DP03_0024P değişkenini kullandı, bu yüzden doğru bir cevapta beklediğim bu.
Sonuçlar: NotebeNlm, Chatgpt ve şaşkınlık bana kullanabileceğim sonuçlar verdi. (Beklenmedik bir şekilde, birden fazla doğru cevap olduğunu öğrendim – chatgpt ve şaşkınlık, evden çalışan insanların yüzdesini içeren başka değişkenler de buldu.)
Claude bu konuda rekabet edemedi, çünkü toplam 800KB’den az veriye sahip üç .txt dosyam “proje bilgisi” sınırını aştı.
Test 4: Profesyonel konferanslar hakkında sorun
Bu test iki farklı veri kaynağı için iki soru içeriyordu: İhtiyaçlarıma uyabilecek bir konferans sorun ve ardından belirli bir konferansta konferans oturumlarını sor.
Soru 1: “Yapay zeka hakkında konuşacak IDG etkinlikleri arıyorum. Boston’dan 2 saatlik bir uçuş içinde olmalarını istiyorum.”
Bilgi Kaynağı: . IDG Global Etkinlikler Takvimi PDF.
Beklenen sonuç: En eksiksiz doğru cevap Futureit New York’u Temmuz ayında ve Futureit Toronto’nun 30 Nisan – 1 Mayıs. Nashville’de 2:50 uçuşunda da makul bir öneri olacaktır.
Sonuçlar: Chatgpt, hem daha gelişmiş O3-Mini-High modeli hem de genel 4o LLM ile çiviledi ve kriterlerle tam olarak eşleşen iki olayı iade etti.
Perplexity’nin Sonar LLM’si, 2 saatlik bir uçuşun ötesinde olduğunu kabul etmesine rağmen, Arizona’daki CIO100 konferansını da geri döndürdü.
DeNbooklm kısmen doğru yaptı, Nashville’de Futureit New York ve Çalışma+ ‘nı önererek (doğru bir şekilde “Boston’a makul bir şekilde yakın” olduğunu söyledi – doğru, 3 saatten daha az uzakta). Ancak Toronto’yu kaçırdı.
Claude, büyük sonnet 3.5 modeli ile her iki eşleşen etkinliği de yanı sıra “seyahat aralığınızın dışında olsa da referans için İngiltere etkinlikleri” ile geri döndürdü – ancak Nashville’i içermedi. Claude, varsayılan ortamında yeni sonnet 3.7 ile daha kötüydü, sadece eşleşen bir tane, ABD’de birkaç tane ve iki Avrupa’da (bunların seyahat aralığının dışında olduğunu belirtti). Sonnet 3.7’yi varsayılandan “genişletilmiş” akıl yürütmeye değiştirdiğimde, daha iyi bir yanıt verdi: hem New York hem de Toronto etkinlikleri ve sanal bir olay.
Soru 2: “Nikar Konferansı’nda elektronik tablolarda zaten yetkin olan insanlar için tüm oturumları söyleyin – yani yeni başlayanlar değiller, ancak elektronik tablo becerilerini geliştirmek istiyorlar.”
Veri Kaynağı: Tam Nikar Veri Gazeteciliği Konferans Programının Metin Dosyası.
Sonuçlar: NotebeBlm bana Google Levh, Excel ve Airtable’ı içeren bir düzineden fazla ilginç öneri verdi ve sadece alakalı olmayan bir tane. Kesinlikle “Excel” ve “Sheets” için konferans web sayfasını arayarak bulduğumdan daha fazlaydı. Artı, alıntı yaptığı kesin program metnini yakınlaştırmak için tıklayabildiğim için, halüsinasyonları kontrol etmek kolaydı.
Beyin fırtınası, birçok uzmanın LLMS’nin parlayabileceğini söylediği bir alandır. Potansiyel olarak yararlı oturumları göz ardı etmediğimden emin olmak için gelecekte NotebElm’e başka konferans programları yüklemeyi planlıyorum.
Chatgpt ayrıca, tarih ve saate göre düzenlenen ve daha güzel biçimlendirilmiş olan 12’den fazla seans buldu. Claude biraz daha az önerdi, ama hepsi eşleşti.
Şaşkınlık hayal kırıklığı yaratıyordu: “Sağlanan bilgiler, elektronik tablolarda yetkin olanlar için açıkça oturumları listelemese de, Nicar 2025 Konferansı’ndaki çeşitli oturumlar elektronik tablo becerilerini geliştirmek veya ileri veri analiz tekniklerini öğrenmek için faydalı olabilir.” Sadece üç tane önerdi.
Öneriler
Üretken AI bulut hizmetleri, kendi bilgilerinizle ilgili soruları cevaplamanın yararlı, kodsuz bir yolu olabilir-hem bildiğiniz bilgileri bulma hem de yeni bilgiler keşfetmenize yardımcı olur.
Halüsinasyonları kontrol edebilmeniz için kolay, ücretsiz ve kaynakları belirten bir platform istiyorsanız, Google’ın NotebeLM mükemmel bir seçimdir.
Zaten chatgpt’e abone olursanız, projeleri bir teste değer. Sadece Soru -Cevaptan daha geniş bir istek yelpazesini ele almak için kurulurlar ve ChatGPT’nin yanıtları genellikle NotebeKlm’lerden daha iyi biçimlendirilir ve okunması daha kolaydır. Ücretsiz bir kullanıcıysanız, geleneksel chatgpt sohbetlerine dosya yükleyebilir ve benzer özellikler alabilirsiniz.
Proje başına büyük miktarda veriniz yoksa Claude iyi bir seçenek olabilir ve özellikle de abone oluyorsanız, özellikle bir GitHub deposundaki verilerle ilgili soruları cevaplamasını istiyorsanız. Bir yanıt tatmin edici değilse, model ayarlarını değiştirmeyi deneyin.
İnternetteki bilgilerle ilgili soruları yanıtlamak için, özellikle de bir alan adında bir alan adında birçok farklı dosyaya yayıldığı yazılım yardımı gibi kullanım durumları için şaşkınlık daha çekici buldum. Slack.com/help. Ancak, muhtemelen yerel veriler için NotebeLM veya ChatGPT ile giderdim.


