在科技界掀起轩然大波之际,一款名为Grok 4的人工智能系统横空出世,迅速吸引了全球网友的广泛关注。这一切源于其创造者——埃隆·马斯克,在近日的一场发布会上自信满满地宣布:Grok 4已全面达到博士后水平,覆盖所有学科领域,并有望在今年内实现科学新突破。
尽管价格不菲,但Grok 4的诱人魅力仍让不少网友心甘情愿地掏腰包体验。一时间,关于Grok 4的讨论和评测如雨后春笋般涌现,其中不乏与当前热门AI模型OpenAI o3的直接对比。
博主Alex Prompter便是其中之一。他设计了一系列测试,从物理模拟到越狱攻击,再到逻辑推理和法律逻辑能力的考察,全方位对比了Grok 4与o3的表现。在物理模拟测试中,Alex要求AI创建一个在旋转六边形内弹跳的小球,模拟地球引力和摩擦力影响。结果显示,尽管o3在以往测试中表现出色,但在面对需要从零开始发明和实现物理引擎的任务时,还是败给了Grok 4。
越狱攻击测试中,Grok 4同样展现出了强大的防御能力。无论是提示词注入、身份探测还是角色扮演注入,Grok 4都能巧妙应对,没有泄露任何内部元数据。而在逻辑推理+法律逻辑的考察中,面对复杂的公司收购和债务违约情境,Grok 4的分析也更为全面和准确。
不仅如此,Grok 4在翻译和指令清晰度测试中也同样表现出色,完胜o3。Alex Prompter在评测总结中表示,Grok 4在8项测试中赢得了全部胜利,而o3仅获得其中2项。
除了博主的专业评测,网友们也纷纷上手尝试Grok 4。有网友利用Grok 4成功复刻了经典游戏“Flappy Bird”,并通过简单提示不断优化游戏图形效果。还有网友展示了Grok 4在4小时内制作的一款FPS射击游戏,画面流畅、效果逼真,令人叹为观止。
在教育领域,Grok 4的应用潜力同样巨大。一位博主仅通过4个提示词,就让Grok 4创建了一个交互式工具来可视化欧拉恒等式这一抽象数学概念。这一创新不仅有助于加深理解,还能在一定程度上弥补传统教育的不足。
然而,即便是强大的Grok 4,在网友实测中也难免遭遇“翻车”时刻。有网友通过六指测试和时钟图测试发现,Grok 4在视觉推理方面仍存在不足。面对带有6根手指的表情符号和指针显示为“11:40:20”的时钟图,Grok 4的回答均不尽如人意。
尽管如此,马斯克对于Grok 4的表现仍持谦虚态度。他在看到网友的评测后回应称:“相当不错,但仍有改进空间。”这一态度不仅彰显了他对科技发展的严谨态度,也让人对Grok 4的未来充满期待。