Yeni sürüm şu anda yalnızca Chatgpt’nin (Plus) ücretli sürümünde mevcuttur. Çok sayıda uzman, profesör, OpenAi müşteri şirketi ve uluslararası basın muhabiri (New York Times gibi) bunu kanıtlamayı başardı. OpenAi ayrıca bugün kendi sitesinde Gpt-4’ü tanıttı ve birkaç test ileriye doğru büyük bir sıçrama yaptığını gösterdi. önceki sürüme kıyasla

Hangi değişiklikler?

OpenAi, Gtp-4’ün ChatGpt’te (bugünkü testimizde hala Gpt 3.5’te) ve API aracılığıyla seçilen şirketlere (bekleme listesiyle birlikte) sunulmasını sağlayacağını söylüyor. Başlıca gelişmeler iki gibi görünüyor: sürüm 4 daha fazla kesin (daha az hata yapar) ve ayrıca görüntüleri analiz edebilir, ayrıntılı olarak açıklayabilir ve hatta ilgili soruları yanıtlayabilir. Örneğin, bir denemede bir kullanıcı ona buzdolabının içinin bir resmini vererek gördüğü yiyeceklerle hangi tarifleri yapabileceğini sordu. Ve bot, bu malzemelerle düzeltilmiş bazı tarifler sağladı. Testlerden ortaya çıkanlara göre, Sürüm 4 kusurlu olmaya devam ediyor. Sürekli kafası karışıyor ve bir şeyler uyduruyor. Ayrıca Ağustos ayında firma verileriyle eğitildiğinden (önceki versiyonun 2021 yılına kıyasla) zaman açısından sınırlı kalıyor.

Arama motoru ile değişim

Microsoft’un ChatGpt’i Bing arama motoruyla birleştirerek aştığı bir sınır.OpenAi ve çeşitli bağımsız testler, çeşitli konularda ve üniversite veya mesleki sınavlardan alınan 14.000 soruya yanıt vermede doğruluk artışını doğruladı. Örneğin ABD’de avukat olmak için bunu aştı. OpenAi testlerine göre, İtalyanca’daki doğruluğun yüzde 84,1 olduğuna ve İngilizce’den sonra en yüksek rakama (yüzde 85,5) dikkat edin. Anıl GehiChapel Hill’deki Kuzey Karolina Üniversitesi’nde tıp profesörü ve kardiyolog olan , chatbot’a bir gün önce gördüğü bir hastanın hastane sonrası komplikasyonları da dahil olmak üzere tıbbi geçmişini anlattı.

İlk ilerlemeyi gördüğünüz yer.

Açıklama, meslekten olmayanların anlayamayacağı birkaç tıbbi terim içeriyordu. Gehi hastaya nasıl davranması gerektiğini sordu ve chatbot ona doğru cevabı verdi. Ayrıca, görüntüleri büyük ayrıntılarla ve ayrıca birçok açıklayıcı metin paragrafıyla tanımlama yeteneği de etkilendi. Örneğin, Hubble Uzay Teleskobu’ndan alınan bir görüntü için yaptı. Vergi muhasebesi veya planlaması gibi diğer alanlarda da eskisinden daha doğruydu. Ayrıca yazdığı uzun bir makalenin doğru bir özetini çıkarmayı başardı. New York Times, ChatGpt’in genellikle başarısız olduğunun bir kanıtı. Bazen sürüm 4 bile yanlış anlıyor, ancak testlerde ortaya çıktığı ve hatta hala bariz bir şekilde parlayabildiği için. Yani, yapay zeka alanında tüm bitki icatlarını tanımlamak için kullanılan teknik bir terim olan “halüsinasyonlar” görmeye devam ediyor. Örneğin, en son kanser araştırmalarını açıklayan web sitelerinin adresleri istendiğinde, bazen var olmayan internet adresleri üretiliyor. Gpt-4’ün ilerlemeleri, daha büyük bir eğitim veri tabanının kullanılması ve insan gözden geçirenlerle daha fazla ince ayar yapılmasından kaynaklanmaktadır. Bu iyileştirmelerin Gpt-4’ün kullanıcılar ve şirketler tarafından API kullanan üçüncü taraf ürünlerde bile pratik kullanımı üzerindeki etkisi önümüzdeki aylarda görülecektir.



genel-18