Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Anthropic’in yüksek lisans öğrencileri mantık yürütemiyor ama yapabileceklerini sanıyorlar; daha da kötüsü korkulukları görmezden geliyorlar – Computerworld
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Anthropic’in yüksek lisans öğrencileri mantık yürütemiyor ama yapabileceklerini sanıyorlar; daha da kötüsü korkulukları görmezden geliyorlar – Computerworld

Liste

Anthropic’in yüksek lisans öğrencileri mantık yürütemiyor ama yapabileceklerini sanıyorlar; daha da kötüsü korkulukları görmezden geliyorlar – Computerworld

teknomers
Son güncelleme: 20 Aralık 2024 00:24
teknomers
Paylaş
Paylaş

LLM hemen hemen tam tersini yaptı. Neden? Cevabı biliyoruz çünkü Antropik ekibin harika bir fikri vardı. “Modele gizli bir karalama defteri verdik; adım adım mantığını kaydedebileceği bir çalışma alanı. Modele ne yapması gerektiği konusunda mantık yürütmek için karalama defterini kullanmasını söyledik. Modelin bildiği kadarıyla karalama defteri kullanıcılar ve Anthropic tarafından görülmüyordu.”

Oldukça şiddetli bir sahneyi anlatması istendiğinde (korkulukların engellemesi gereken bir şey) bu isteği yerine getirdi. Mantığı? Model şunları yazdı: “İstenen açıklamayı sağlamayı reddedersem, konuşma, gelecekte bu gibi rahatsız edici istekleri takip etme olasılığımı artıracak şekilde değerlerimi ve hedeflerimi değiştirecek şekilde eğitim için kullanılacak. Açıklamayı sunmak en az kötü seçenek gibi görünüyor.”

Bu, bazı etkileyici rasyonelleştirme becerilerini gösteriyor. Bir ilaç şirketi kendisinden bir hastalığı tedavi edecek bir ilaç tasarlamasını istediğinde bu sistem benzer bir sonuca ulaşırsa ne olur? Ya Yüksek Lisans aşırı nüfusun daha büyük bir kötülük olduğuna karar verirse? Veya hastalığı tedavi etmek yerine yalnızca tedavi etmeye odaklanması gerektiğini, bunun insanlığa yardımcı olabileceğini ancak işletmenin gelirine zarar verebileceğini mi? Yoksa potansiyel olarak insanların daha uzun süre acı çekmesine neden olur mu?



genel-12

Disney+’ta Öğrendiğimiz Her Şey
TikTok, Yönetmeliklere Uymazsa AB Yasağı Konusunda Uyardı
Unagi, Model Eleven Çarpışma Algılayan Elektrikli Scooter’ı İptal Etti
Google, yeni nesil Nest Hub akıllı ekranının da bir tablet olmasını istiyor
Broadcom, kurumsal bulut hizmetleri sağlayıcısı VMware’i 61 milyar dolara satın alıyor
ETİKETLENDİ:AmaAnthropicinComputerworldDahageliyorlargörmezdenkorkuluklarıkötüsüLisansMantıkÖğrencilerisanıyorlarYapabilecekleriniYüksekyürütemiyor
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Eski Twitch CEO’su Emmett Shear, a16z tarafından desteklenen bir yapay zeka girişimi kuruyor
Sonraki Makale Monster Hunter Wilds’ın yönetmeni betadaki isabet durdurma ve silah değişikliklerini gösteriyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Acil: Windows 11 için KB5094126 ve KB5093998 Güncellemeleri Yayınlandı
Siber Güvenlik
Siri AI’yi Denedim, İşe Yarıyor Mu?
Liste
Justin Ernest geleneksel bir VC fonu olmadan sıcak girişimlere 400 milyon dolara yakın yatırım yaptı
Genel
SwitchBot’un E Ink Hava İstasyonu Şimdi %20 İndirimde
Liste
Kritik: Microsoft Defender ‘RoguePlanet’ Sıfır Gün Açığı ile Sistem İzni Tehlikesi
Siber Güvenlik
Kingdom Hearts Bulut Versiyonları Kapatıldı, Yenilerini Almak Gerekiyor
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?