ITBear旗下自媒体矩阵:

实测豆包深度思考模式,能否与DeepSeek一较高下?

   时间:2025-02-26 16:39:32 来源:极客公园作者:极客公园编辑:快讯团队 发表评论无障碍通道

字节跳动旗下的AI助手豆包近期正在低调测试其深度思考模型,据豆包团队内部人士透露,此次测试涵盖了多个实验版本,旨在探索和优化深度思考功能。

据知情人士报道,豆包所测试的深度思考模型是在豆包1.5基座模型的基础上进一步研发而成的。早在今年1月中旬,豆包大模型团队发布豆包1.5Pro时,就已预告了深度推理模型Doubao-1.5-pro-AS1-Preview的存在,强调在不依赖其他模型数据的前提下,通过强化学习(RL)算法的突破和工程优化,结合Test Time Scaling的算力优势,成功实现了RL Scaling,推出了豆包的深度思考模式。

实际体验中,部分用户在与豆包对话时注意到,豆包生成的答案开始尝试展示推理过程的思维链,但这一功能尚未稳定出现。同时,豆包的对话页面也尚未明确提供“深度思考”功能的入口。

近期,腾讯旗下的AI应用“腾讯元宝”在苹果应用商店的下载排行榜上超越了豆包,位居第二(第一名仍为deepseek)。随着腾讯、百度等多个应用接入deepseek,字节的豆包如何应对这一竞争态势,成为业界关注的焦点。目前,豆包的应对策略已初露端倪。

豆包此番加入“深度思考”行列,标志着其向更高级别的AI能力迈进。此前,具备深度思考能力的模型以OpenAI的o1系统为代表,但该系统采用闭源策略,且仅限付费用户使用。而DeepSeek则通过开源策略、降低成本以及交互创新,率先将深度思考能力大规模普及。DeepSeek发布的R1-Lite-Preview成为国内首个对标o1的推理模型,并在后续开源了R1模型,其核心创新在于透明化思维链、展示完整的推理过程,包括自我质疑、假设验证等拟人化思考路径,且推理成本远低于o1。

DeepSeek的深度思考模式通过显性化AI模型的推理过程,增强了用户的理解。其核心技术——思维链(Chain of Thought, CoT),模拟人类的思考过程,让AI模型输出中间步骤,如自我质疑和反思。在深度思考模式下,用户不仅能看到AI的最终答案,还能观察到模型解决问题的完整逻辑链条。

豆包在测试中展现了一定的深度思考能力。虽然目前“深度思考”功能的入口尚未在对话页面明确显示,且该功能触发不稳定,但被灰度测试的用户在提出某些问题时能够体验到该功能。通过与deepseek的对比测试,可以看出两者在深度思考上的不同表现。

在面对简单的数学问题“9.11和9.9谁大”时,豆包虽然初次回答简洁,但在第二次提问时触发了深度思考模式,不仅给出了答案,还考虑了用户可能的误解,展示了多种可能性。而deepseek的思考过程同样详细,甚至更为全面,体现了自我质疑和反复验证的特点。

在探讨哲学问题“意识的本质是什么?AI会获得自我意识吗?”时,豆包的回答更偏向于哲学理论分类,讨论了物理主义、二元论等观点,并提及了关于AI权利的伦理讨论。而deepseek的回答则更为技术导向,涉及神经科学、量子理论等,还提到了法律案例和具体数据,展现了其在技术细节上的深入。

通过本次实测,豆包在深度思考模式上的初步表现令人瞩目。尽管仍处于测试阶段,功能的稳定性和入口尚未全面开放,但其对推理过程的展示已为用户提供了更直观的理解路径。未来,随着豆包深度思考功能的不断完善,其在AI领域的竞争力有望进一步提升。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version