Opus 4.7 SimpleBench得分低于前代引网友热议
2026-04-23 12:39:47
20次阅读
0个评论
Opus 4.7在SimpleBench基准测试得分低于4.5、4.6版本,网友就基准合理性、模型表现差异展开讨论,有人认为其自适应思考遇陷阱题易出错,也有用户反馈它在代理编码场景表现好坏不一,Anthropic侧重优化代码能力或致其他领域波动。
收藏 0 0

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注