滚动资讯

当前位置：财经 > 信息流 > 正文内容

纽约闭路导航测试：生成式AI模型的“世界理解”能力遭质疑

时间：2024-11-17 14:08:34 来源：DeepTech深科技作者：DeepTech深科技编辑：瑞雪 发表评论无障碍通道

在人工智能领域，大型语言模型（LLMs）以其卓越的能力惊艳了世人，无论是创作诗歌还是编写计算机程序，它们都能游刃有余。然而，这些模型是否真的理解了世界的本质？一项新的研究对此提出了质疑。

研究人员发现，一种常见的生成式AI模型在纽约市提供驾驶路线时，准确率极高，但实际上并未形成准确的城市地图。当测试环境发生变化，如关闭部分街道或添加绕行路线时，模型的表现迅速下滑。深入分析后，他们发现模型生成的纽约地图中，存在大量不存在的街道，这些街道连接着远离实际的交叉路口。

为了更深入地理解这一现象，研究人员开发了新的评估指标，以测试LLMs的世界模型。他们选择了两个具有明确规则的问题：纽约市街道导航和奥赛罗棋盘游戏。通过这两个指标，他们发现，尽管模型能生成准确的导航方向和有效的棋步，但它们并未真正理解规则，生成的世界模型也不连贯。

这项研究的结果对生成式AI模型在现实世界中的应用产生了深远影响。一个在某环境中表现良好的模型，在环境稍有变化时可能会完全失效。研究人员指出，如果科学家希望构建能够捕捉准确世界模型的LLMs，需要采用不同的方法。

研究人员还发现，随机选择的Transformer模型在生成世界模型时，比使用策略训练的模型更准确。这可能是因为前者在训练中看到了更多潜在的下一步选择。然而，即使这些模型能生成准确的导航方向和有效的棋步，它们的世界模型仍然不连贯。

这项研究的结果提醒我们，尽管LLMs在某些任务中表现出色，但我们不应过分依赖它们。科学家需要更深入地理解这些模型的运作机制，以构建更准确、更可靠的人工智能系统。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

2024大湾区科学论坛前瞻：诺奖得主齐聚南沙，科技成果路演亮点纷呈！

11-17

从无到有！新四军如何在艰苦环境中研制出首批手榴弹？

11-17

广州首现超140%得房率住宅，招商林屿境引爆楼市新潮流！

11-17

武汉二手房市场回暖，10月售价首次止跌转涨！

11-17

天舟八号成功发射背后：“01”指挥员张楠期待更多同行者

11-17

天舟八号货运飞船成功“送货上门”，航天员开启太空“拆快递”模式

11-17

11-17

11-17

11-17

11-17

我国海上风电装机将突破4500万千瓦，连续四年居全球首位

11-17

明年起，拟延长至63周岁！

11-17

印度成功进行远程高超音速导弹飞行试验

11-17

科学防治肺癌，这些知识了解一下！

11-17

【科股宝VIP周度特刊】本周国内外科技大厂带着AI应用刷屏，您都体验了没？交易所动态认真读~

11-17

点击查看更多 +

全站最新

科学防治肺癌，这些知识了解一下！

华为云赋能中企出海：案例揭秘，运维升级助力GMV暴涨300%

【科股宝VIP周度特刊】本周国内外科技大厂带着AI应用刷屏，您都体验了没？交易所动态认真读~

台州富豪遭起诉！或被动清仓上市公司持股！刚被法院悬赏

陈冬的航天梦：6年封闭训练，成就太空英雄，双胞胎儿子成家庭新成员

淡水咸水都能活？三刺鱼的进化秘密竟是基因更活跃！

热门内容

本栏最新

2024大湾区科学论坛前瞻：诺奖得主齐聚南沙，科技成果路演亮点纷呈！

从无到有！新四军如何在艰苦环境中研制出首批手榴弹？

广州首现超140%得房率住宅，招商林屿境引爆楼市新潮流！

武汉二手房市场回暖，10月售价首次止跌转涨！

天舟八号成功发射背后：“01”指挥员张楠期待更多同行者

天舟八号货运飞船成功“送货上门”，航天员开启太空“拆快递”模式

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.