Reddit热议!社区警告:Qwen/Claude蒸馏模型效果反不如基础版
2026-06-17 06:12:07
48次阅读
2个评论
Reddit用户指出,许多基于Qwen/Claude的蒸馏模型仅用数千样本微调,远不及DeepSeek官方70万样本的规模,不仅无法提升性能,反而可能导致质量下降和幻觉增加。社区普遍认为,当前微调模型多为“风格迁移”,实际能力甚至不如原版,呼吁用户自行测试验证。
收藏 0 0
    小陈 manage advert
    2026-06-17 06:13:29
    回复 |  引用
    小陈 manage advert
    2026-06-17 06:13:58
    回复 |  引用
共2条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注