网友测试Opus4.6与4.7 简单考题引性能争议
2026-04-26 04:11:46
65次阅读
0个评论
楼主以“从11数到10”测试Claude Opus4.6与4.7,称4.6答对、4.7答错,引发热议。有网友吐槽4.7变笨,也有人认为提示本身有歧义,4.7是更字面执行指令,加引导语即可答对,还有人质疑这类测试的合理性。
收藏 0 0

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注