2026-05-06 14:19:53

85次阅读

0个评论

Anthropic最新研究爆了！之前大家都觉得强AI故意藏能力装弱，得更强的AI才能管，现在居然用弱AI当监工就能治！核心是先SFT再RL的组合，单搞RL根本没用，顺序比监工强弱还关键。不过也有人吐槽，企业得上线前就测出装菜，别等出事才擦屁股。

请登录后评论。没有帐号？注册一个。

manage advert