ITBear旗下自媒体矩阵:

Grok 4实测:马斯克最贵AI表现如何?网友直呼“2万块就这”

   时间:2025-07-11 18:47:10 来源:AppSo编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在人工智能的舞台上,新角色的登场总是伴随着无尽的期待与争议。最近,Grok 4在万众瞩目中亮相,马斯克甚至称其为“地球上最聪明的AI”。然而,随着各路网友的实测案例纷至沓来,Grok 4的真实实力逐渐浮出水面。

编程领域,Grok 4展现出了令人惊艳的一面。博主@mckaywrigley让它用three.js创建一个动画,让虚拟人物排列出“你好,世界,我是Grok”的字样,并完成镜头切换。Grok 4不仅成功完成任务,还主动调用3D模型资源,整个过程流畅自然。在C语言编程和DQN强化学习模拟等测试中,Grok 4同样表现出色,代码严谨且专业。

然而,高光时刻并非总能持续。在博主@karminski3的经典物理测试项目中,Grok 4多次出现语法错误,即便成功运行的版本也仅算“勉强可用”。在另一项烟囱爆破模拟任务中,虽然重力方向正确,但倒塌效果不尽如人意,粒子模拟怪异,烟雾渲染模糊。

写作方面,Grok 4在语义连贯和记忆保持上表现出色,在192k上下文窗口的测试中仅次于Gemini。它能够根据复杂要求创作出一首六行诗,涵盖爱情、背叛、复仇等元素,且读起来颇为顺畅。但在短篇小说创意写作上,Grok 4的情节容易套路化,结尾寡淡,语言偏炫技。

在SVG图像生成测试中,Grok 4的表现同样喜忧参半。它能够生成美国本土地图轮廓,虽然地理细节略糊,但轮廓逻辑完整。在还原线条漫画为纯SVG的任务中,Grok 4的人物动作自然。然而,在绘制Radiohead的《In Rainbows》封面时,构图稍显单薄,层次感不足。

Grok 4在可视化方面也展现出了不俗的实力。网友@techartist_利用Grok 4编写了一个交互式3D黑洞模拟项目,精细还原了恒星背景及震撼视觉效果。然而,在面对一些逻辑测试题时,Grok 4也会犯错,例如在一道逻辑选择题中给出了错误答案。

在推理能力测试中,Grok 4同样展现出了变通性。在一道复杂的场景推理题中,Grok 4在思维链展开、逻辑推理和法律框架建构方面表现出色。然而,在沃顿商学院教授Ethan Mollick抛出的一项商业策划任务中,虽然Grok 4在应对竞争对手时调整能力更强,但在整体任务完成度上,尤其是工具调用和模拟主动执行任务的能力方面,稍逊于OpenAI的o3。

综合来看,Grok 4并非无所不能。它在三维生成、逻辑建模等方面展现出深厚的技术实力,但在UI设计、图像理解等基础任务上仍有待提升。正如微软CEO纳德拉所言,许多大模型陷入“基准测试作弊”的陷阱,徒有分数而无助于解决实际问题。Grok 4离真正的通用人工智能(AGI)还有很长一段距离,但无论如何,它仍然是当下最具话题度的AI之一。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version