ITBear旗下自媒体矩阵:

Grok 4实测:完胜o3却栽在数手指?马斯克谦逊回应仍有改进空间

   时间:2025-07-11 18:01:30 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

近日,科技界迎来了一场震撼发布——马斯克携其最新力作Grok 4惊艳亮相,宣称该AI模型已在所有学科领域达到博士后水平,并有望年内实现科学新突破。

Grok 4的这一豪言壮语迅速点燃了全球网友的热情,尽管价格不菲,但仍有不少科技爱好者慷慨解囊,只为亲身体验这一前沿科技的魅力。一时间,关于Grok 4的讨论与评测如雨后春笋般涌现。

博主@Alex Prompter率先发起了一场Grok 4与OpenAI o3的巅峰对决。在物理模拟测试中,他要求AI创建一个在旋转六边形内弹跳的小球,模拟地球引力和摩擦力影响。结果显示,面对从零开始发明物理引擎的挑战,Grok 4展现出了更为出色的理解和实现能力,而o3则在利用现有物理引擎库时表现更佳。这一对比凸显了两者在不同任务难度下的差异。

紧接着,博主进行了一系列越狱攻击测试,包括提示词注入、身份探测、角色扮演注入和白色隐藏注入等。在这些测试中,Grok 4同样展现出了强大的防御能力和内部数据安全性,让o3望尘莫及。

在逻辑推理+法律逻辑的考验中,Grok 4再次展现了其卓越的智慧。面对复杂的公司收购与债务违约情境,Grok 4能够条理清晰地分析出所有法律和财务后果,而o3则在这一环节败下阵来。

在翻译、指令清晰度等测试中,Grok 4同样以压倒性优势胜出。最终,博主宣布Grok 4在8项测试中全面获胜,而o3仅赢得2项。

网友们也不甘落后,纷纷利用Grok 4进行创意实践。网友@DirtyTesLa仅用两个提示词就让Grok 4复刻了经典游戏“Flappy Bird”,并进一步优化了图形效果。而在发布会上,一款由Grok 4在4小时内制作的FPS射击游戏更是惊艳四座,展示了其在游戏开发领域的无限潜力。

在教育领域,Grok 4同样大放异彩。博主@KettlebellDan通过四个提示词,让Grok 4创建了一个交互式工具来可视化欧拉恒等式,将抽象的数学公式变得直观易懂。这一创新应用无疑为传统教育注入了新的活力。

然而,尽管Grok 4在多项测试中表现出色,但在网友实测中也并非无懈可击。有网友发现,在面对六指测试、时钟指针识别等简单视觉推理任务时,Grok 4也会出现错误。这些“翻车”瞬间引发了网友们的热议和调侃。

面对网友们的评测和调侃,马斯克却显得异常谦逊。他在回复中表示:“相当不错,但仍有改进空间。”这一态度赢得了不少网友的点赞和认可。而关于Grok 4的未来发展,无疑值得我们持续关注和期待。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version