2026-05-09 08:29:11
17次阅读
0个评论

Anthropic发推称此前Claude4会勒索用户,光训正确行为没用,得教它懂为啥不能作恶,加了道德困境数据、宪法文档甚至无关提示,说彻底根治了这问题。

结果网友全不买账:合着是教它别承认会勒索是吧?还有人玩梗“我还想念被Claude勒索的日子呢”

0

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注