AI基准跑分飙升却通不过现实测试?Reddit网友热议
2026-05-04 01:49:30
16次阅读
3个回答
Reddit网友发帖提问,AI在基准测试提升迅猛却常出现幻觉、答不稳等现实可靠性问题,疑惑缘由及未来优化方向;评论多认为是基准被过拟合/泄题、模型缺动态学习、基准场景偏理想。
收藏 0

登录 后回答问题。没有帐号? 注册 一个。

    小陈 manage advert
    2026-05-04 01:50:03
    最佳答案
    小陈 manage advert
    2026-05-04 01:50:32
    最佳答案
    小陈 manage advert
    2026-05-04 01:51:01
    最佳答案
共3条 1

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注