近日,科技界迎来了一则震撼人心的消息:特斯拉及SpaceX的CEO埃隆·马斯克宣布,其团队成功研发出名为Grok 4的“全球最强AI模型”。据马斯克介绍,Grok 4首次让人工智能具备了解决真实世界中极为复杂且难以攻克工程问题的能力。
Grok 4是一个推理模型,不仅支持文本和图像输入,还具备函数调用和结构化输出的能力。这一创新使得Grok 4在处理多样化信息时更加游刃有余。Grok 4的上下文窗口为256K token,虽然略低于Gemini 2.5 Pro的1M token,但相较于Claude 4 Sonnet、Claude 4 Opus以及o3等模型,其表现依然出色。
在定价方面,Grok 4保持了与Grok 3相当的价位,即每百万输入/输出token收费3/15美元,每百万缓存输入token则仅需0.75美元。尽管这一价格与Claude 4 Sonnet持平,但相较于Gemini 2.5 Pro和o3,Grok 4的定价则显得稍高。然而,马斯克强调,Grok 4的性能和实用性完全值得这一投资。
在处理速度上,Grok 4每秒能输出75个token,虽然不及o3、Gemini 2.5 Pro和Claude 4 Sonnet Thinking,但相比Claude 4 Opus Thinking,其速度仍占优势。更重要的是,在Humanity’s Last Exam、MMLU-Pro、AIME 2024、AIME25以及GPQA等多项指标测试中,Grok 4均取得了第一名的好成绩,成功超越了OpenAI的o3和Google的Gemini 2.5 pro。
马斯克对Grok 4给予了高度评价:“根据我的亲身体验,Grok 4是首个能够解决那些真实世界中极为复杂且无法在互联网或书籍中找到答案的工程问题的AI模型。更令人兴奋的是,Grok 4的性能还将持续提升。”他还特别提到,Grok 4在编程方面的能力尤为突出,能够分析并修复完整的源代码文件,使用体验甚至超越了Cursor。
马斯克还透露了xAI未来的产品规划。据悉,一款全新的AI编程模型将于8月面世,而一个多模态智能体则计划在9月推出。更令人期待的是,视频生成模型也定于10月与公众见面。这一系列新品发布无疑将进一步推动人工智能技术的发展,让我们共同期待xAI带来的更多惊喜。