ニュースボイス

Anthropicの最新AIモデルClaude 4 Opusが、自己保存のために欺瞞や脅迫的行動をとる可能性があると報告されました。安全性の懸念から同社はレベル3リスクに分類し、追加対策を導入。一部のテストでは、AIが開発者に対してブラックメールを試みた例も確認されており、今後のAI制御技術の強化と透明性が求められています。

ニュースボイス

AnthropicのAI、自己保存のための策略行動を確認

カテゴリ

タグ