近日,科技界迎来了一场震撼人心的发布活动。北京时间2月18日中午,埃隆·马斯克携其xAI团队的三位核心成员,通过一场视频直播,向全球推出了他们最新的语言大模型——Grok 3。马斯克自信地宣称,这款人工智能是“地球上最聪明”的存在。
尽管外界对Grok 3的成熟度持有一定的保留意见,认为它可能仍带有半成品的痕迹,但其所展现的性能数据无疑在业界,特别是科技爱好者群体中引起了巨大轰动。发布会后,A股市场上,连续数周受到热炒的DeepSeek概念高位股出现了大幅下跌,仿佛预示着新时代的到来。
在随机LLM“陷阱”测试中,Grok 3的表现同样值得关注。它能够正确回答一些对人类简单但对LLM困难的问题,如“strawberry”中有几个“r”等。然而,在幽默感和复杂伦理问题方面,Grok 3似乎仍有待提高。例如,在生成笑话方面,Grok 3的表现并不出色,而且它对某些复杂伦理问题的回答也显得过于谨慎。