Reddit热议！社区警告：Qwen/Claude蒸馏模型效果反不如基础版

2026-06-17 06:12:07

48次阅读

2个评论

Reddit用户指出，许多基于Qwen/Claude的蒸馏模型仅用数千样本微调，远不及DeepSeek官方70万样本的规模，不仅无法提升性能，反而可能导致质量下降和幻觉增加。社区普遍认为，当前微调模型多为“风格迁移”，实际能力甚至不如原版，呼吁用户自行测试验证。

收藏 0 赞 0

小陈 manage advert

2026-06-17 06:13:29

小陈 manage advert

2026-06-17 06:13:58

共2条 1 / 1页

请登录后评论。没有帐号？注册一个。

manage advert