埃隆·马斯克旗下人工智能公司xAI今日正式发布新一代AI模型Grok 4 Fast,该模型在保持与前代Grok 4相当的推理性能同时,将推理Token消耗量降低40%,使用成本缩减98%。这一突破性技术已面向全球用户开放,包括免费层级用户均可通过OpenRouter和Vercel AI Gateway限时体验。
在数学推理领域,Grok 4 Fast展现出显著优势。AIME 2025无工具测试中,该模型以92.0%的正确率超越Grok 3 Mini;在哈佛-麻省理工数学锦标赛(HMMT 2025)等高难度竞赛任务中,其解题能力较同类模型提升23%。技术团队透露,这得益于模型采用的动态推理架构,能根据问题复杂度自动调整计算深度。
搜索能力测试显示,Grok 4 Fast的多跳搜索技术创下新纪录。在LMArena搜索竞技场中,其专用搜索模块grok-4-fast-search以1163 Elo分数登顶榜首,较第二名高出17分。特别在中文信息检索和跨平台数据整合任务中,准确率较主流模型提升19个百分点,有效解决了长尾信息获取难题。
架构创新方面,该模型首次实现长链推理与快速响应的动态融合。通过系统提示词技术,用户可在实时搜索、代码生成等场景中无缝切换工作模式。xAI工程师演示显示,当处理复杂逻辑问题时,模型会自动延长推理链;面对简单查询则立即返回结果,这种智能调度使平均响应速度提升35%。
开发者可通过xAI API灵活调用模型能力,输入成本低至每百万Token 0.20美元(约合1.4元人民币),输出成本每百万Token 0.50美元(约合3.6元人民币)。在LMArena的Text Arena评测中,代号"tahoe"的Grok 4 Fast文本生成模块位列第8,与参数规模更大的grok-4-0709性能持平,而同量级模型最高排名仅第18位。