ITBear旗下自媒体矩阵:

OpenAI公开o3思维链,DeepSeek开源浪潮下的开放新动向?

   时间:2025-02-07 22:15:13 来源:ITBEAR作者:ITBEAR编辑:快讯团队 发表评论无障碍通道

在科技界的最新动态中,OpenAI于2月6日对外揭示了其o3-mini系列模型的思维链(CoT)技术,这一举措在人工智能领域引起了广泛关注。

值得注意的是,OpenAI此番公布的并非思维链的原始版本。思维链,顾名思义,是指模型在解决问题时所展现的中间推理步骤,这一机制类似于人类在面对复杂问题时拆解任务、逐步推导的过程。通过这一技术,用户能够直观地观察到大型模型是如何动态思考并给出回应的。

在国内市场,用户已经能够在DeepSeek深度思考R1模型以及kimi的k1.5长思考模型中体验到类似的动态思考推理过程。例如,当用户输入“算八字”的指令时,DeepSeek R1会展示其思维链并给出相应答复;同样,对于“圣杯一的含义”这样的查询,kimi也会显示出详细的推理步骤。

OpenAI的研究员Noam Brown在社交平台上提到,“See CoT Live”通常标志着大模型的“顿悟时刻”。然而,他同时也指出,尽管已经非常接近,但此次公布的并非真正的原始思维链。对于这一决定,OpenAI方面解释称,他们正在努力整理原始的CoT以提升可读性,并在必要时提供翻译,以确保内容的忠实度。

OpenAI首席产品官Kevin Weil则表示:“我们深知用户对此的期待,OpenAI会找到一个恰当的平衡点来满足大家的需求。”这一表态引发了业界的广泛讨论,有人将DeepSeek R1模型与OpenAI的新动向进行了对比,认为OpenAI此举是在看到DeepSeek的影响后,开始打破过去的封闭策略。

事实上,OpenAI此前一直未公开思维链的一个重要原因在于“保密性”,以保护其技术领先地位。一位开发者指出,思维链可能包含模型的内部工作机制,一旦公开,竞争对手可能会利用这些信息来改进自己的模型。思维链中还可能包含敏感数据或信息,如果模型在训练过程中接触过机密数据,这些数据可能会在思维链中泄露,从而损害公司的利益。

然而,思维链的开放也带来了显著的价值。一位海外开发者认为,公开推理过程可以使开发者更容易发现错误环节,从而消除歧义并引导AI给出更准确的回答。DeepSeek的开源策略正是基于这一理念,其创始人梁文峰曾表示,开源并不会失去什么,反而能够吸引更多的技术人员跟随和贡献。

meta的首席AI科学家杨立昆也公开表示,开源模型正在超越专有模型,DeepSeek提出了新想法,并在他人的工作基础上进行了构建。由于DeepSeek的工作是公开且开源的,因此每个人都可以从中受益。

近日,OpenAI CEO Sam Altman罕见地发表了检讨,承认在开源方面他们一直站在历史的错误一边,并在内部承认了开源问题上的保守策略是一个战略失误。这一表态进一步印证了OpenAI正在尝试更多开放性的举措。

随着DeepSeek的开源以及OpenAI的开放动作,全球的大模型公司都面临着如何保持竞争力的挑战。对于更多公司而言,其价值和估值也将受到严峻考验。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version