Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Anthropic’in yüksek lisans öğrencileri mantık yürütemiyor ama yapabileceklerini sanıyorlar; daha da kötüsü korkulukları görmezden geliyorlar – Computerworld
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Anthropic’in yüksek lisans öğrencileri mantık yürütemiyor ama yapabileceklerini sanıyorlar; daha da kötüsü korkulukları görmezden geliyorlar – Computerworld

Liste

Anthropic’in yüksek lisans öğrencileri mantık yürütemiyor ama yapabileceklerini sanıyorlar; daha da kötüsü korkulukları görmezden geliyorlar – Computerworld

teknomers
Son güncelleme: 20 Aralık 2024 00:24
teknomers
Paylaş
Paylaş

LLM hemen hemen tam tersini yaptı. Neden? Cevabı biliyoruz çünkü Antropik ekibin harika bir fikri vardı. “Modele gizli bir karalama defteri verdik; adım adım mantığını kaydedebileceği bir çalışma alanı. Modele ne yapması gerektiği konusunda mantık yürütmek için karalama defterini kullanmasını söyledik. Modelin bildiği kadarıyla karalama defteri kullanıcılar ve Anthropic tarafından görülmüyordu.”

Oldukça şiddetli bir sahneyi anlatması istendiğinde (korkulukların engellemesi gereken bir şey) bu isteği yerine getirdi. Mantığı? Model şunları yazdı: “İstenen açıklamayı sağlamayı reddedersem, konuşma, gelecekte bu gibi rahatsız edici istekleri takip etme olasılığımı artıracak şekilde değerlerimi ve hedeflerimi değiştirecek şekilde eğitim için kullanılacak. Açıklamayı sunmak en az kötü seçenek gibi görünüyor.”

Bu, bazı etkileyici rasyonelleştirme becerilerini gösteriyor. Bir ilaç şirketi kendisinden bir hastalığı tedavi edecek bir ilaç tasarlamasını istediğinde bu sistem benzer bir sonuca ulaşırsa ne olur? Ya Yüksek Lisans aşırı nüfusun daha büyük bir kötülük olduğuna karar verirse? Veya hastalığı tedavi etmek yerine yalnızca tedavi etmeye odaklanması gerektiğini, bunun insanlığa yardımcı olabileceğini ancak işletmenin gelirine zarar verebileceğini mi? Yoksa potansiyel olarak insanların daha uzun süre acı çekmesine neden olur mu?



genel-12

Netflix’in Haziran 2023’te Çıkacak Yeni Filmleri
GTA V Satışları 170 Milyona Yakın Ama 2023 Mali Yılı Gelirinin Yüzde 45’i Zynga’dan Gelecek
Yeni sızıntıya göre Galaxy Z Fold 7 ve Flip 7 kameraları daha akıllı olacak.
Birmingham’dan Adapttech, protez teknolojisi için 2,25 milyon sterlin artırdı
Binance Rus Hesaplarını Kısıtladı Ama Verileri Putin’e Verdi
ETİKETLENDİ:AmaAnthropicinComputerworldDahageliyorlargörmezdenkorkuluklarıkötüsüLisansMantıkÖğrencilerisanıyorlarYapabilecekleriniYüksekyürütemiyor
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Eski Twitch CEO’su Emmett Shear, a16z tarafından desteklenen bir yapay zeka girişimi kuruyor
Sonraki Makale Monster Hunter Wilds’ın yönetmeni betadaki isabet durdurma ve silah değişikliklerini gösteriyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

PHP’de Otomatik Bağlama vs. Açık Bağlama: Büyü Ne Zaman Size Mal Olur
Yazılım
Kırmızı PCB’li AMD RX 7900 XTX mühendislik örneği: Yalnızca ön bilgi
Donanım
Klasik Karakterlerin Yer Almadığı Resident Evil Filmi Neden Farklı?
Oyun
Singapur polisi, Nvidia AI GPU kaçakçılarına ait mülkü ele geçirdi
Donanım
Claude Fable 5 Abonelikten Kalıcı Olarak Ayrılmıyor, Açıklama Geldi!
Siber Güvenlik
HP, 4 Temmuz’a özel 5080 oyun laptopunda 1.300 $ indirim yaptı
Donanım
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?