近日,科技巨头马斯克麾下的xAI公司在一场备受瞩目的直播发布会上,隆重推出了其最新的旗舰人工智能模型——Grok 4。这场发布会不仅吸引了全球科技爱好者的目光,更在行业内掀起了波澜。
在直播过程中,xAI公司巧妙地引入了“人类最后的考试”(HLE)这一概念,以此作为衡量不同AI模型能力的参照系。在这一框架下,OpenAI、谷歌旗下的Gemini,以及中国的新兴力量月之暗面Kimi成为了被比较的焦点。Kimi在上个月刚刚发布了其首款Agent产品——Deep Researcher,这款产品在HLE测试中的表现尤为亮眼。
据发布会介绍,Deep Researcher在HLE测试中超越了Gemini 2.5 Pro,表现略优于OpenAI的某深度研究模型,并与Gemini-Pro的Deep Research Agent打成平手。这一成绩无疑将Deep Researcher推向了全球AI领域的最前沿,成为目前已知的最高水平AI模型之一。
海外社交媒体上,Deep Researcher的发布引发了AI从业者的一片赞誉。许多网友纷纷表示,这款来自中国的AI产品给他们留下了深刻的印象。有网友直言,Deep Researcher可能是他用过的最好的深度研究模型,其视觉效果尤为出色。更有博主对Deep Researcher的深度研究能力和准确性表示高度赞赏。
AI创业者Poonam Soni也在社交媒体上发文称,ChatGPT已经不再是不可逾越的巅峰。她对中国Kimi公司发布的Deep Researcher产品表示惊叹,认为这是一款基于模型的Agent,而非简单的工具套用,展现了极高的技术水平和创新能力。
海外AI研究者Casper同样对Kimi公司给予了高度评价,他认为Kimi已成为来自中国的顶级竞争者,与DeepSeek、字节跳动等巨头并驾齐驱,共同引领着全球AI领域的发展潮流。
据了解,Kimi Deep Researcher在执行研究任务时,会平均进行23次推理,通过模型判断筛选出信息质量最高的内容,剔除冗余及低质信息,自动生成分析结论。这一过程不仅确保了研究结果的严谨性,还有效避免了模型幻觉的产生,为用户提供了更加准确、可靠的研究支持。