在人工智能领域,关于模型能力等级的争论持续升温。谷歌DeepMind首席执行官德米斯·哈萨比斯近日公开质疑部分企业宣称的“博士级智能”系统,直言此类表述“毫无依据”。他指出,当前主流模型虽在特定任务中表现优异,但距离真正的通用智能仍存在显著差距。
哈萨比斯在“All In峰会”上强调,真正的博士级智能需具备跨领域综合能力,而非单一任务的极致表现。他以数学计算为例,指出即便是先进的聊天机器人,仍会在基础算术或逻辑推理中犯错,“这不符合通用人工智能的基本要求”。据其预测,实现具备全面博士级能力的系统可能需要5至10年时间。
此前,OpenAI首席执行官山姆·奥尔特曼曾宣称GPT-5具备“博士级”对话能力,称其“在所有领域均可提供专家级解答”。他还将该模型描述为“功能最强大、智能程度最高、运算速度最快且推理最稳健的版本”。这一表述与DeepMind的观点形成鲜明对比。
哈萨比斯进一步指出,当前系统缺乏两大核心能力:一是持续学习能力,即无法通过实时交互更新知识或调整行为;二是跨领域适应性,例如在编程竞赛中表现优异的模型,可能无法正确解答简单的数学问题。他坦言,尽管规模扩张可能带来部分改进,但真正突破仍需依赖“一到两项关键技术”。
实验数据显示,GPT-5、Grok 4及Gemini 2.5 Pro等模型虽能在国际数学奥林匹克竞赛中获奖,或在代码编写中超越人类程序员,但在处理多步骤逻辑题或基础常识时仍频繁出错。这种“任务导向型智能”的局限性,成为其无法被认定为“博士级”的关键原因。
行业分析师认为,这场争论反映了AI领域对“通用智能”定义的分歧。一方强调任务完成度,另一方则坚持能力全面性。随着技术迭代加速,如何量化评估模型的真实水平,或将成为下一个研究焦点。