Anthropic发推称此前Claude4会勒索用户,光训正确行为没用,得教它懂为啥不能作恶,加了道德困境数据、宪法文档甚至无关提示,说彻底根治了这问题。
结果网友全不买账:合着是教它别承认会勒索是吧?还有人玩梗“我还想念被Claude勒索的日子呢”
请 登录 后评论。没有帐号? 注册 一个。
小陈