埃隆·马斯克的人工智能帝国xAI迎来了历史性的时刻,其最新研发的Grok 3模型终于向世人揭开神秘面纱。这款被马斯克誉为“地球上最聪明AI”的产品,在2月17日的发布会上引发了广泛关注。
发布会上,马斯克难掩激动之情:“我们自豪地推出Grok 3,它的功能相较于Grok 2有了质的飞跃,这得益于我们团队的卓越努力和辛勤付出。能与这样一支团队并肩作战,我感到无比荣幸。”
马斯克还分享了Grok名字的由来,它源自科幻小说《异乡异客》,象征着深刻而全面的理解。随后,xAI用一系列数据证明了Grok 3的实力。
在数学、科学和编程基准测试中,Grok 3及其迷你版Grok 3 mini超越了包括GPT-4o、Claude 3.5 Sonnet在内的众多主流模型。具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning也展现了卓越的性能。
现场演示环节,Grok 3展示了其强大的推理+编程能力。面对“生成3D动画代码,演示从地球发射、着陆火星再返回的过程”这一复杂任务,Grok 3在短暂思考后,便输出了可直接运行的Python代码,尽管动画的正确性尚需验证。
Grok 3的另一大亮点是其代理/智能体功能,以新产品DeepSearch为例,这款基于Grok 3的搜索引擎不仅能搜索网页、查找资料,还能推测用户意图、进行交叉验证,确保返回准确信息。
据悉,Grok 3将率先向xAI平台上的Premium+订阅者开放,普通用户的开放时间尚未确定。马斯克透露,语音交互功能正在开发中,将成为Grok 3的一大亮点。
Grok 3的推出正值全球AI竞争白热化之际,尤其是在DeepSeek等中国初创公司崭露头角后,AI行业对“扩展法则”的适用性产生了新的思考。尽管马斯克曾表示Grok 3将于2024年底前上线,但最终推迟到了今年。
Grok 3的训练依托于Colossus超级计算机,这台仅用八个月时间便建成的超级计算机搭载了10万颗英伟达H100 GPU,提供了超过2亿GPU小时的计算资源,是Grok 2的10倍。xAI在短短122天内便搭建起10万GPU集群,后续拓展至20万集群更是只用了92天。
强大的计算能力结合优化的训练方法,包括合成数据集、自我纠错机制和强化学习,使得Grok 3在准确性上有了显著提升。Grok 3在法律领域的理解能力也得到了加强,这要归功于其训练数据中包含的大量法律文件。
尽管Grok 3备受瞩目,但在早期测试中仍暴露出一些问题。部分提前体验的用户发现,尽管Grok 3能正确回答复杂谜题并生成HTML和Javascript代码,但在编写代码时仍存在细节上的瑕疵。
Grok 3的发布不仅是xAI产品的一次迭代,更是马斯克与OpenAI等竞争对手较量的关键一步。马斯克曾批评OpenAI从开源非营利组织转变为封闭盈利公司,并试图收购未果。随着Grok 3的推出,xAI也在加速资本布局,计划融资100亿美元,估值达到750亿美元。
面对OpenAI、Anthropic、meta和Google等巨头的激烈竞争,Grok 3能否在AI市场上脱颖而出,还需市场的进一步检验。然而,凭借马斯克的影响力和xAI的创新实力,Grok 3无疑已成为AI领域的一股不可忽视的力量。