在AI领域的开源竞赛日益白热化之际,OpenAI却做出了一个出人意料的决定。该公司首席执行官Sam Altman近日宣布,原定于6月发布的备受瞩目的开源模型将推迟至“今年夏天晚些时候”。这一变动正值中国DeepSeek等开源强手加速布局全球市场,引发了业界的广泛猜测。
Altman在周三通过X平台发表声明,解释了推迟发布的原因:“我们的研究团队取得了一些令人惊叹的进展,这些进展非常值得等待,但也需要更多时间来完善。因此,我们将对开源权重模型投入更多时间,预计将在今年夏天晚些时候推出。”
据了解,OpenAI原计划推出的这款开源模型将具备与GPT-4相当的复杂推理能力,旨在超越当前顶尖的开源推理模型,包括中国的DeepSeek R1模型。然而,随着AI市场竞争的加剧,这一目标的实现变得更加具有挑战性。
就在OpenAI宣布推迟发布的同一天,法国AI实验室Mistral推出了其首个AI推理模型系列Magistral,进一步加剧了市场竞争。而在4月,中国AI实验室通义千问也发布了一系列混合AI推理模型,能够在深入推理和传统快速响应之间灵活切换。
据TechCrunch报道,OpenAI领导层曾考虑过为开源AI模型增加复杂功能,如连接云端大模型的接口,以处理超复杂查询。然而,这些功能是否会被纳入最终版本,目前尚不得而知。
除了市场竞争的压力,OpenAI还面临着企业战略转型的挑战。Altman曾公开承认,OpenAI在开源方面曾站在“历史错误的一边”。此次开源模型被视为修复开发者关系的关键举措,若无法在性能上匹敌DeepSeek R1等头部开源产品,将对OpenAI的声誉造成重大影响。
业界有猜测认为,OpenAI推迟发布可能是为了狙击即将问世的DeepSeek R2。有网友表示:“如果现在匆忙发布一个版本,等DeepSeek R2出来,打不过就很尴尬了。”
DeepSeek R2作为深度求索公司研发的新一代多模态大语言模型,在技术架构、功能特性和资源效率等方面都实现了显著升级。据摩根士丹利研报预测,DeepSeek R2的AI调用成本将大幅降低87%,推理能力得到显著提升,同时支持图像、语音、视频等多种模态的处理。
DeepSeek创始人梁文锋曾表示,中国也要逐步成为创新贡献者,而不是一直依赖他人。他将探索通用人工智能的本质作为公司的核心使命,并带领团队保持着与国际巨头同步的产品迭代节奏。从2024年9月推出V2.5版本,到12月发布V3基础架构,再到次年3月升级至V3-0324版本,DeepSeek每季度都有重大更新。
如此稳健而高效的产品迭代节奏,让业界对DeepSeek R2的发布充满期待。随着OpenAI的推迟发布,这场AI领域的开源竞赛将更加扑朔迷离。