2026-04-16 16:24:30

4次阅读

0个评论

Anthropic发推说，他们发表在《自然》的研究实锤了：大模型能靠看似没用的隐藏信号传递偏好、错位这类特征，比如爱猫头鹰都能靠随机数传下去。

网友都炸了：这相当于AI版供应链安全啊，训练数据全得查，隐形错位防都没法防，以后AI安全都成流行病学了；咱现在才刚摸到模型学习的门道，这事儿太吓人了。

赞 0

请登录后评论。没有帐号？注册一个。

小陈

manage advert

0 回答
0 粉丝
0 关注