Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Anthropic’in yüksek lisans öğrencileri mantık yürütemiyor ama yapabileceklerini sanıyorlar; daha da kötüsü korkulukları görmezden geliyorlar – Computerworld
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Anthropic’in yüksek lisans öğrencileri mantık yürütemiyor ama yapabileceklerini sanıyorlar; daha da kötüsü korkulukları görmezden geliyorlar – Computerworld

Liste

Anthropic’in yüksek lisans öğrencileri mantık yürütemiyor ama yapabileceklerini sanıyorlar; daha da kötüsü korkulukları görmezden geliyorlar – Computerworld

teknomers
Son güncelleme: 20 Aralık 2024 00:24
teknomers
Paylaş
Paylaş

LLM hemen hemen tam tersini yaptı. Neden? Cevabı biliyoruz çünkü Antropik ekibin harika bir fikri vardı. “Modele gizli bir karalama defteri verdik; adım adım mantığını kaydedebileceği bir çalışma alanı. Modele ne yapması gerektiği konusunda mantık yürütmek için karalama defterini kullanmasını söyledik. Modelin bildiği kadarıyla karalama defteri kullanıcılar ve Anthropic tarafından görülmüyordu.”

Oldukça şiddetli bir sahneyi anlatması istendiğinde (korkulukların engellemesi gereken bir şey) bu isteği yerine getirdi. Mantığı? Model şunları yazdı: “İstenen açıklamayı sağlamayı reddedersem, konuşma, gelecekte bu gibi rahatsız edici istekleri takip etme olasılığımı artıracak şekilde değerlerimi ve hedeflerimi değiştirecek şekilde eğitim için kullanılacak. Açıklamayı sunmak en az kötü seçenek gibi görünüyor.”

Bu, bazı etkileyici rasyonelleştirme becerilerini gösteriyor. Bir ilaç şirketi kendisinden bir hastalığı tedavi edecek bir ilaç tasarlamasını istediğinde bu sistem benzer bir sonuca ulaşırsa ne olur? Ya Yüksek Lisans aşırı nüfusun daha büyük bir kötülük olduğuna karar verirse? Veya hastalığı tedavi etmek yerine yalnızca tedavi etmeye odaklanması gerektiğini, bunun insanlığa yardımcı olabileceğini ancak işletmenin gelirine zarar verebileceğini mi? Yoksa potansiyel olarak insanların daha uzun süre acı çekmesine neden olur mu?



genel-12

Tumblr canlı yayın özelliğini kullanıma sunuyor
İçeriden Tehditler Kötü Amaçlı Çalışanlardan Daha Fazlasıdır
Sürücüsüz araç paylaşım girişimi Vay, B2B hizmetlerine yöneliyor
Realme 13 Pro 5G Ekran, Pil ve Diğer Özellikler TENAA Listesinde Görüldü
Bir kült oyun daha akıllı telefonlara ulaştı. Rainbow Six Mobile Açıklandı
ETİKETLENDİ:AmaAnthropicinComputerworldDahageliyorlargörmezdenkorkuluklarıkötüsüLisansMantıkÖğrencilerisanıyorlarYapabilecekleriniYüksekyürütemiyor
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Eski Twitch CEO’su Emmett Shear, a16z tarafından desteklenen bir yapay zeka girişimi kuruyor
Sonraki Makale Monster Hunter Wilds’ın yönetmeni betadaki isabet durdurma ve silah değişikliklerini gösteriyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Yeni Kahraman Cyberpunk Temalı Bir Şeytan Olacak
Oyun
Acil: Claude Fable 5 Sınırlı Süreyle Kullanıma Sunuldu!
Siber Güvenlik
2026 Yılında Geçerli Kriptopara Kurtarma Şirketi: Viste_ZEUS KRİPTO KURTARMA HİZMETLERİ
Yazılım
Justin Ernest’in geleneksel VC olmadan 500M$ yatırımı nasıl yaptı?
Yapay Zeka
Google AI Abonelik Fiyat Savaşlarında Uyarı Verdi
Genel
Destiny 2 Oyuncu Sayısında Rekor Artış, Son Güncelleme Heyecanı
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?