Reddit热议Anthropic Opus 4.7模型性能与测试争议
2026-04-18 22:10:51
125次阅读
0个评论
这个测试显示Opus 4.7以更少token微弱领先人工分析,运行成本4406美元,比Opus 4.6便宜但仍高于其他模型。网友讨论模型迭代、吐槽该基准测试脱离实际,还差评Gemini的工具调用能力,不少用户怀念被削弱前的旧版模型。
0
0
相关帖子
- 网友测试Opus4.6与4.7 简单考题引性能争议
- Opus 4.7在NYT测试中表现暴跌,引Reddit用户热议
- Opus 4.7 Max用户转用Kimi 2.6 引Reddit网友热议AI模型竞争
- Anthropic砍掉Pro计划Claude Code的Opus模型引用户热议
- Claude Opus4.7强制更新引不满,大量用户吐槽性能下滑
- Claude Opus 4.7数学基准测试表现拉胯,被GPT新版本碾压
- Anthropic员工AI代理交易实验引争议 强弱模型差距藏隐忧
- Kimi K2.6被称可替代Opus 4.7 引发Reddit热议
- Reddit用户讨论Opus 4.7表现不佳的原因
- Reddit网友热议本月大模型使用体验与性能对比