Opus 4.7 SimpleBench得分低于前代引网友热议

2026-04-23 12:39:47

20次阅读

0个评论

Opus 4.7在SimpleBench基准测试得分低于4.5、4.6版本，网友就基准合理性、模型表现差异展开讨论，有人认为其自适应思考遇陷阱题易出错，也有用户反馈它在代理编码场景表现好坏不一，Anthropic侧重优化代码能力或致其他领域波动。

收藏 0 赞 0

请登录后评论。没有帐号？注册一个。

manage advert