滚动资讯

当前位置：财经 > 信息流 > 正文内容

阿里云QwQ模型开源：AI推理能力卓越，数学编程表现惊艳

时间：2024-11-29 15:14:54 来源：快科技作者：快科技编辑：瑞雪 发表评论无障碍通道

阿里云通义团队近日震撼发布并开源了其最新研发的AI推理模型QwQ-32B-Preview，这一举动在AI领域掀起了波澜。

据官方介绍，QwQ（Qwen with Questions）在科学推理能力上表现出色，特别是在数学和编程领域，其预览版本已展现出研究生级别的实力。在多项评测中，QwQ的表现均可与OpenAI的o1系列模型相抗衡。在GPQA评测集中，QwQ的准确率高达65.2%，而在AIME评测中，它则以50%的胜率证明了其在解决数学问题上的强大能力。

不仅如此，QwQ在MATH-500评测中以90.6%的高分超越了o1-preview和o1-mini，同时在LiveCodeBench评测中也答对了一半的题目，编程竞赛题场景同样难不倒它。QwQ之所以能够取得如此优异的成绩，得益于其深度自省和质疑自身假设的能力，通过深思熟虑的自我对话，仔细审视推理过程的每一步。

QwQ作为阿里云通义千问Qwen大模型的实验性研究模型，一经发布便在魔搭社区和HuggingFace等平台上引起了全球开发者的广泛关注。开发者们对QwQ的评价极高，认为它是“完全没有预料到的疯狂的跃进”、“今年开源领域最重大的突破”，并称赞这一模型让中国在开源大模型和AI推理上占据了先机。

然而，通义团队也坦诚地指出了QwQ目前存在的局限性，如不同语言的混合使用、偶有不恰当偏见以及对专业领域问题的不了解等。但团队表示，随着研究的深入和模型的迭代，这些问题将逐步得到解决。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

造纸厂实验室废液如何处理？揭秘高效环保的废液处理设备

11-29

霍金预警：2023年地球或迎冰川时代，人类该如何应对？

11-29

科技研学新地标！鄂尔斯市东胜区象限空间营地启动，激发青少年科学梦

11-29

商业航天新蓝海：卫星遥感携手通信导航共创未来

11-29

中国太空实验曝光，竟是空间站升级秘密武器？

11-29

华南首个卫星相控阵天线基地封顶，2025年投产助力卫星互联网新基建

11-29

北斗未来已来！2035年前发展规划正式发布

11-29

北斗导航精度再升级，未来计划曝光：2035年建成下一代系统！

11-29

中国北斗：稳定运行，高精度服务，全球影响力持续攀升！

11-29

中国载人登月进入冲刺阶段，女性航天员能否踏上月球之旅？

11-29

12月“星空盛宴”来袭，你准备好了吗？

11-29

中国北斗：精准服务全球，三十年创新引领未来！

11-29

中国载人登月倒计时：登月服就位，美国新款何时见？

11-29

全球首艘商用液化二氧化碳运输船交付

11-29

东芝将在日本裁员超过3000人。（共同社）

11-29

点击查看更多 +

全站最新

12月“星空盛宴”来袭，你准备好了吗？

中国北斗：精准服务全球，三十年创新引领未来！

中国载人登月倒计时：登月服就位，美国新款何时见？

博思软件新设智能科技公司，布局软件开发及远程健康管理服务

郑州航空港科创城建设开发公司正式成立，注册资本达5亿

马云旗下农业新公司杭州开业，注册资本达千万美元

热门内容

本栏最新

守护舌尖安全！郫都区突击检查网红餐厅

知识窗｜银杏树为什么特别“长寿”

封面评论 | 餐饮评分失真，守护“真实消费意见”要拿出更有效办法

知“艾”防“艾”！健康双流直通车进社区，开展“世界艾滋病日”主题科普宣传

增强青少年应急能力社区开展安全“零距离”知识培训

昆明土地市场年末爆发：19宗地块上架，起拍总价34.8亿能否顺利成交？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.