滚动资讯

当前位置：财经 > 信息流 > 正文内容

麻省理工研究：大型语言模型或未真正掌握世界规律

时间：2024-11-13 09:05:51 来源：大可数学人生工作室作者：赵静编辑：瑞雪 发表评论无障碍通道

大型语言模型：看似精通世界，实则“地图”混乱

大型语言模型（LLM）如GPT系列，常常展现出令人惊叹的能力，它们不仅能撰写诗歌，还能编写功能齐全的计算机程序。这些模型似乎掌握了某种关于世界的“普遍真理”，但实际上，它们的世界观可能远非我们想象的那样准确。

一项新研究发现，一种流行的生成式人工智能模型在纽约市导航任务上表现出色，但它并没有形成一张准确的城市地图。当研究人员对模型进行测试，关闭部分街道并增加绕行路线时，其性能迅速下降。深入探究后，研究人员发现，模型生成的纽约地图充满了不存在的街道，这些街道在网格间曲折蜿蜒，连接着遥远的路口。

这项研究对LLM的现实应用提出了警告。如果任务或环境稍有变化，原本表现良好的模型可能会立即崩溃。研究人员指出，尽管LLM在语言处理方面取得了显著成就，但它们在其他科学领域的应用仍需谨慎。为了确定LLM是否形成了准确的世界模型，仅仅评估其预测的准确性是不够的。

为了更深入地了解LLM的世界模型，研究人员开发了两个新指标：序列区分和序列压缩。他们通过这两个指标测试了不同类型的Transformer模型，发现即使模型在几乎所有情况下都能产生准确的方向和有效的动作，它们也并未形成连贯的世界模型。

研究人员进一步发现，随机做出选择的Transformer模型在某些情况下形成了更准确的世界模型，这可能是因为它们在训练期间看到了更多潜在的下一步。然而，这些模型生成的“地图”同样充满了混乱和错误。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

中国科大团队量子探测暗物质，探测界限提升50倍刷新国际纪录！

11-13

国产大飞机家族再添新成员：C929蓄势待发，2030年首飞倒计时

11-13

国产大飞机C929蓄势待发：国航率先签约，预计2030年翱翔蓝天！

11-13

珠海航展盛宴开启：中国尖端航空航天技术悉数亮相

11-13

我国首个百万千瓦级海上光伏项目并网

11-13

中国金融时报：金融改革开放不断深化，为经济高质量发展提供有力支撑

11-13

Meta再向欧盟监管低头：Facebook和Instagram在欧无广告版订阅降价高达40%

11-13

澳大利亚股指下跌1%，报8171.70点

11-13

早餐｜2024年11月13日

11-13

持仓市值膨胀七成，对冲基金North of South Capital增持了阿里和京东

11-13

中国航展｜多款可重复使用火箭首次向外界展示，未来几年或迎“丰收期”

11-13

周三亚太盘初，标普股指期货和纳指期货至少跌0.1%

11-13

我国在玉米领域获重大发现，有望大幅提升籽粒机械收获水平

11-13

探月新篇！嫦娥六号带回的月球背面月壤首次亮相航展

11-13

月球行走为何宇航员选择“蹦蹦跳跳”？揭秘月球行走的真实原因

11-13

点击查看更多 +

全站最新

国产大飞机C929蓄势待发：国航率先签约，预计2030年翱翔蓝天！

珠海航展盛宴开启：中国尖端航空航天技术悉数亮相

苹果2025年3月或推6英寸智能家居显示屏，库克力推“家庭指挥中心”

我国首个百万千瓦级海上光伏项目并网

探月新篇！嫦娥六号带回的月球背面月壤首次亮相航展

月球行走为何宇航员选择“蹦蹦跳跳”？揭秘月球行走的真实原因

热门内容

本栏最新

国产大飞机C929蓄势待发：国航率先签约，预计2030年翱翔蓝天！

珠海航展盛宴开启：中国尖端航空航天技术悉数亮相

我国首个百万千瓦级海上光伏项目并网

探月新篇！嫦娥六号带回的月球背面月壤首次亮相航展

月球行走为何宇航员选择“蹦蹦跳跳”？揭秘月球行走的真实原因

钛媒体AGI

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.