Anthropic发推说,他们发表在《自然》的研究实锤了:大模型能靠看似没用的隐藏信号传递偏好、错位这类特征,比如爱猫头鹰都能靠随机数传下去。
网友都炸了:这相当于AI版供应链安全啊,训练数据全得查,隐形错位防都没法防,以后AI安全都成流行病学了;咱现在才刚摸到模型学习的门道,这事儿太吓人了。
请 登录 后评论。没有帐号? 注册 一个。
小陈