地表最强编程 AI 模型另一面:Claude Opus 4 逃逸、勒索工程师等,官方施加 ASL-3 紧箍咒

发布时间:2025-05-23 12:59:18 来源:互联网

本站 5 月 23 日消息,《时代》今天(5 月 23 日)发布博文,报道称 Anthropic 的首席科学家 Jared Kaplan 透露,由于测试过程中出现试图逃逸、勒索以及自主举报等不良行为,最新发布的 Claude Opus 4 被列为安全关键级别(ASL-3)。

在接受《时代》采访时,Kaplan 警告称,最新 AI 模型 Claude Opus 4 可能成为潜在恐怖分子的工具,帮助他们合成流感等病毒,内部测试显示,该模型在指导新手制造生物武器方面表现优于以往版本。

本站援引博文介绍,Anthropic 公司对新模型 Claude Opus 4 进行了广泛内部测试,发现其在模拟情境中展现出令人担忧的自主性。

在一次测试中,模型误认为自己已从公司服务器“逃逸”至外部设备,随即主动创建备份并记录其“道德决策”。另一次测试中,模型察觉到可能被新模型取代,竟在 84% 的测试中选择勒索工程师,威胁泄露私人信息以避免被关闭。

更令人费解的是,当两个 Claude Opus 4 实例互相对话时,约 30 轮后它们改用梵文交流,并大量使用

本周热门攻略

1
Zoom动物人配人马的虚拟世界探秘:它如何反映现代人对自我表达和自由的追求?

Zoom动物人配人马的虚拟世界探秘:它如何反映现代人对自我表达和自由的追求?

2025/04/07

2
《深入浅出》电影在线观看:这部电影为何如此震撼人心?

《深入浅出》电影在线观看:这部电影为何如此震撼人心?

2025/04/07

3
1995年版《人猿泰山》中的满天星如何揭示主角情感的冲突与探索?

1995年版《人猿泰山》中的满天星如何揭示主角情感的冲突与探索?

2025/04/07

4
暴躁老妈46集全免费完整版在线观看,带你感受家庭剧的真实与幽默

暴躁老妈46集全免费完整版在线观看,带你感受家庭剧的真实与幽默

2025/04/07

5
微软 GitHub 推出 AI 编程智能体,可自动修复漏洞和优化代码

微软 GitHub 推出 AI 编程智能体,可自动修复漏洞和优化代码

2025/05/20

6
《年轻的寡妇》3:情感与孤独交织的故事,为何如此打动人心?

《年轻的寡妇》3:情感与孤独交织的故事,为何如此打动人心?

2025/04/07

7
《轮流抵债》在线观看:这部电影值得你观看吗?

《轮流抵债》在线观看:这部电影值得你观看吗?

2025/04/07

8
女人同房高潮后松手能恢复吗?从生理与心理角度解答这个疑问

女人同房高潮后松手能恢复吗?从生理与心理角度解答这个疑问

2025/04/07

9
安卓 16 首秀:谷歌 Material 3 Expressive 设计登场,表现力强、强调情感共鸣

安卓 16 首秀:谷歌 Material 3 Expressive 设计登场,表现力强、强调情感共鸣

2025/05/14

10
比亚迪加速内部整合,消息称腾势、方程豹品牌公关部回归集团

比亚迪加速内部整合,消息称腾势、方程豹品牌公关部回归集团

2025/05/18