阿里巴巴在科技创新的道路上再次迈出重要一步,正式推出了全新的推理模型——通义千问QwQ-32B,并宣布在全球范围内以Apache2.0协议开源。这一举措不仅意味着开发者可以免费获取并使用这一尖端技术,还展现了阿里巴巴在推动AI技术普及和应用方面的坚定决心。
千问QwQ-32B是阿里巴巴通义团队经过多轮大规模强化学习训练后的成果。在数学、代码及通用能力上,该模型实现了显著提升,其性能与业界知名的DeepSeek-R1模型不相上下。尤为千问QwQ-32B在保持高性能的同时,还极大地降低了部署成本,使得用户即便在消费级显卡上也能轻松实现本地部署。
据了解,千问QwQ-32B的研发过程历经艰辛。阿里巴巴通义团队在冷启动的基础上,针对数学、编程任务以及通用能力进行了两轮深入的大规模强化学习,最终在32B的模型尺寸上取得了令人瞩目的推理能力提升。这一成果不仅验证了大规模强化学习在提升模型性能方面的巨大潜力,也为未来的AI技术发展提供了宝贵经验。
在多个权威基准测试中,千问QwQ-32B的表现均十分亮眼。在数学能力测试AIME24评测集上,以及代码能力评估LiveCodeBench中,千问QwQ-32B的表现与DeepSeek-R1相当,远超OpenAI-o1-mini及相同尺寸的R1蒸馏模型。在由meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌提出的指令遵循能力IFeval评测集,以及加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B均取得了超越DeepSeek-R1的优异成绩。
千问QwQ-32B不仅具备强大的推理能力,还具备低资源消耗的特点,非常适合需要快速响应或对数据安全要求较高的应用场景。开发者和企业可以在消费级硬件上轻松实现本地部署,并根据实际需求进行高度定制化的AI解决方案开发。这一特性无疑将极大地推动AI技术的普及和应用。
千问QwQ-32B还集成了与智能体Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。这一创新性的设计使得千问QwQ-32B在应对复杂问题时更加灵活和智能,也为未来的AI技术发展提供了新的思路。
目前,千问QwQ-32B已在多个平台如魔搭社区、HuggingFace及GitHub上基于宽松的Apache2.0协议开源。用户可以通过这些平台免费下载模型进行本地部署,或者通过阿里云百炼平台直接调用模型API服务。对于需要云端部署的用户,阿里云PAI平台提供了快速部署、模型微调、评测和应用搭建等一站式服务。用户还可以选择容器服务ACK搭配阿里云GPU算力(如GPU云服务器、容器计算服务ACS等),实现模型容器化部署和高效推理。
自2023年以来,阿里巴巴通义团队已经开源了200多款模型,涵盖了文本生成、视觉理解/生成、语音理解/生成、文生图及视频模型等全模态领域,以及从0.5B到110B等全尺寸参数范围。其中,千问Qwen系列模型在全球范围内受到了广泛关注和认可,衍生模型数量已突破10万,成为全球最大的开源模型族群之一。