DeepSeek最强对手来了!阿里巴巴放出重磅炸弹
2025-03-07 08:06:32来源:互联网
自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!

今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。
目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。
据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。
在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。
受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

相关攻略
- 推荐几款免费高清观看及编辑PPT的在线软件:满足各种办公需求软件教程玩法
- 两个学霸边做题边C我-原来这是他们提升学习效率的秘密!
- 51吃瓜:原来真有这么一出!
- 免费b站必看的3000部网页电影-免费b站必看的3000部网页电影合集版v4.5.1
- 东北老肥口味重69:探索生活中的小确幸
- 一级理论和二级理论的区别-网友:这些差异让我豁然开朗
- 黄瓜视频app-黄瓜视频app不收费版v3.1.8
- 成品网站入口隐藏通道:隐秘通道设计-提升网站的安全与隐私防护软件教程玩法
- 夫妻晚上一起看电影-哪些电影最适合你们共同度过美好时光
- 一起草-www-17c-com如何帮助企业提升内容创作效率与SEO优化
- 糖心logovlog免费网页版:如何在没有设计基础的情况下轻松制作Logo和Vlog
- 黑土被-黄漫扒衣服:这真是我心灵的避风港!
- 伊人直播app-网友:真的是一款不可错过的直播平台!
- 女性第一次经历:如何让“处破女”在第一次中更舒适与自信
- 我爱搞-52g.app-网友分析:无广告清爽体验-完美满足你的一切需求软件教程玩法
- 地下偶像sans双男主:这太真实了!
- Anomalous-Coffee安卓下载:优缺点解析-让我更了解选择
- 换7交流群怎么加入-了解加入换7交流群的几种方式-快速融入群聊
- 51吃瓜:这背后的故事不简单
- EHVIEWER官方入口下载方法:如何快速安装并解决常见下载问题