新京报客户端

好新闻 无止境

立即打开
通义千问开源32B模型“以小博大”性能比肩DeepSeek
新京报 记者 罗亦丹 编辑 胡萌
2025-03-06 15:06

新京报贝壳财经讯(记者罗亦丹)北京时间3月6日凌晨,通义千问在官方公号上发文称,推出最新的推理模型 QwQ-32B。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的 DeepSeek-R1媲美。


通义千问表示,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1 通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。


其在文章中展示了在一系列基准测试中与DeepSeek-R1、o1-mini等模型的功能对比,如在测试数学能力的 AIME24 评测集上,以及评估代码能力的LiveCodeBench 中,千问 QwQ-32B 表现与DeepSeek-R1相当,胜于 o1-mini 及相同尺寸的R1 蒸馏模型。


目前,QwQ-32B 已在 Hugging Face 和 ModelScope 开源,并采用了 Apache 2.0 开源协议。


编辑 胡萌

校对 王心


来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
美国解禁H20芯片AB面,黄仁勋一年三次来华的“芯”事
科技
阿里发布新一代千问3模型,其8种模型版本全部开源
科技
AI技术浪潮下的企业决策革命:深演智能科技公司如何用「智能体」重构商业价值?
企业资讯
Qwen 3发布,Founder Park围绕开源模型的生态价值采访心言集团高级算法工程师左右
企业资讯
一栋屋、一封信,阿里巴巴再一次自我突破
企业资讯
西湖论剑|“让安全更智能 让智能更安全”:安恒信息AI+新品发布会举行
企业资讯
哈工大(深圳)成果转化系列活动 新材料+AI专场圆满落幕
企业资讯
四维度实测更新后Manus:任务成功率上升,复杂任务仍难胜任
科技
大模型震荡时刻:DeepSeek掀桌百度开源 免费成必答题
科技
零一万物“落子苏州” 将与阿里云一起探索产业大模型落地
科技

新京报报料邮箱:67106710@bjnews.com.cn