滚动资讯

当前位置：财经 > 信息流 > 正文内容

这个访谈回应了所有AI焦点问题！他是AI最重要论文的联合作者

时间：2024-11-23 17:05:10 来源：华尔街见闻作者：华尔街见闻编辑：瑞雪 发表评论无障碍通道

作者：硬AI

AI狂飙突进的时代，真的要结束了吗？

随着scaling law撞墙新闻爆出，全球科技圈、资本市场关于大模型发展触及天花板的讨论愈演愈烈。那么，AI发展是否放缓？后续又将如何发展？商业模式如何突破？

针对一系列焦点问题，人工智能领域最具影响力的论文《Attention Is All You Need》的联合作者，Cohere联合创始人兼CEO Aidan Gomez在访谈中分享了自己对AI发展的深度见解。

他认为，LLM发展已进入平台期，而推理能力将成为未来突破口，并将带来新的商业模式和市场机遇。同时，他也提醒投资者警惕模型价格倾销，关注 AGI 发展趋势。

对于scaling law放缓的问题，Gomez认为，简单扩大模型规模带来的边际效益正在递减。以绘画为例，Gomez指出 LLM 的发展初期如同用大笔触快速完成基础构图，但随着模型需要处理更精细的任务，如同绘画需要越来越细的笔触来完善细节，模型改进需要的数据也越来越精细，这导致获取高质量数据的成本越来越高，最终模型的规模化发展将受限于人类知识的边界和专家数据的获取难度。

推理能力方面，Gomez表示，推理能力可以让 LLM 不仅简单地记忆输入输出对，还可以像人类一样进行多步骤的思考和推理，解决更复杂的问题。而这，这带来了一个革命性的变化——企业不必再为提升AI能力投入巨额固定成本，而是可以通过增加推理时间来实现。用通俗的话说，就是从"买更大的算力"变成了"多给AI一点思考时间"。

Gomez还认为，推理时间计算量的增加还将对芯片层和数据中心建设产生影响，未来需要开发更适合处理推理任务的芯片，以及建设更适合分布式计算的数据中心。

以下是访谈内容精编：

LLM发展进入平台期，推理能力将成未来突破口

问：LLM 发展是否已经进入平台期？未来的突破口在哪里？

Gomez：

LLM 性能提升已进入平台期，边际效益递减。[2， 6] 简单地扩大模型规模带来的性能提升有限，就像油画创作从大笔触的构图阶段进入到需要用越来越细的笔触来完善细节的阶段。模型改进需要越来越精细的数据。LLM 在处理简单、常见的任务时可以快速提升，但在处理更专业、敏感的领域（如科学、数学）时，性能提升的难度越来越大，因为需要更精细、专业的数据来训练模型。推理能力将成为 LLM 未来发展的新突破口。[3， 5] 推理能力可以让 LLM 不仅简单地记忆输入输出对，还可以像人类一样进行多步骤的思考和推理，解决更复杂的问题，例如多项式求解。

问：影响模型规模化发展的因素有哪些？

Gomez：

合成数据可以帮助模型在某些领域（如代码、数学）提升性能。因为这些领域的答案易于验证，可以通过合成大量数据来训练模型。但在其他需要真实世界知识的领域（如生物学、化学），数据的获取难度更大，需要依赖专家知识。最终，模型的规模化发展将受限于人类知识的边界和专家数据的获取难度。2. 推理能力将带来新的商业模式和市场机遇

问：推理能力将如何改变行业格局？

答：

推理能力的出现将带来新的商业模式。客户可以通过增加推理时间计算量来获得更智能的模型，而无需等待数月进行新的模型训练。这意味着客户可以根据需求灵活地调整模型性能，获得更好的产品体验。这种从资本支出（CAPEX）模式到消费模式的转变将吸引更多客户投资于解决问题，而无需承担高昂的训练成本和时间成本。推理时间计算量的增加还将对芯片层和数据中心建设产生影响，未来需要开发更适合处理推理任务的芯片，以及建设更适合分布式计算的数据中心。

问：如何理解推理能力？

答：

目前的 LLM 缺乏像人类一样的“内心独白”，无法进行多步骤的推理思考。它们只能根据输入直接给出输出，而不能像人类一样在解决问题时进行思考、尝试、纠错，最终找到解决方案。推理能力的加入将使 LLM 可以像人类一样进行多步骤的思考和推理。这种能力将通过使用人类数据和合成数据，明确地收集人们的内心想法并进行训练来实现。

问：什么类型的问题更适合使用推理能力解决？

答：

任何需要多步骤解决的问题都更适合使用推理能力来解决。例如，多项式求解，人类在解决这类问题时，需要将其分解成多个步骤，逐步解决，最终得到答案。而目前的 LLM 只能通过记忆的方式来解决这类问题。

问：市场普遍低估了推理时间计算的哪些方面？

答：

推理时间计算在提供智能方面的作用尚未被市场充分认识。推理能力的加入为客户提供了一种新的选择：客户可以通过增加推理时间计算量来获得更智能的模型。3. Cohere: 自主研发模型，打造差异化竞争优势

问：Cohere 为什么选择自主研发模型？

答：

虽然开源模型提供了基础模型，但微调效果不如自主研发。自主研发能够控制数据和训练过程，为客户提供更多定制化选项。

问：LLM 是否适用于所有领域？

答：

虽然 Transformer 模型可以处理很多问题，但在某些领域可能效率较低，例如图结构数据。在这些领域，可能需要更专业的模型才能实现更高的效率。4. 警惕模型价格倾销，关注 AGI 发展趋势

问：市场上 LLM 价格下降是否意味着模型商品化？

答：

市场上出现的模型价格下降并非商品化的标志，而是价格倾销的结果。模型构建需要高度的技术能力，只有少数公司掌握核心技术。未来市场将受到增长压力和投资回报率的影响，目前以亏损或免费提供昂贵技术的做法是不可持续的。

问：如何看待 AGI 的发展？

答：

AGI 并非一个非黑即白的概念，而是一个持续发展的过程，我们已经在构建通用智能机器的道路上取得了很大进展。超级智能的快速发展和自我提升并不会导致像电影“终结者”中那样的人类灭绝。人类将利用人工智能技术创造富足，而不是依赖于一个“上帝”般的超级智能来实现。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

载人月球探测工程新进展：火箭飞船月球车初样研制中！

11-23

印度航天野心勃勃：2040年前欲建月球轨道空间站，能否如愿？

11-23

美国多地现“神秘火球”，实为SpaceX卫星解体，环境隐患引担忧

11-23

仁神星掩星明晚上演，御夫座恒星将短暂“隐身”奇观待赏

11-23

成都市老年人助餐点生态网络建设项目启动探索数字助力社区韧性治理路径

11-23

国际金价“五连涨” 金饰价格重回810元之上｜封面财经

11-23

赚8千万后被重罚3.35亿 “85”后团伙操纵股价“亏本而归”｜封面深镜

11-23

“理响巴蜀”进校园巡回宣讲活动走进四川轻化工大学三位高校宣讲者分享正能量故事

11-23

猴痘疫情仍构成“国际关注的突发公共卫生事件”

11-23

老艺术家与实力新生代，这场音乐会全都有！

11-23

封面食饮观察丨山姆肥牛片变“肥油片”，产品标准何在？

11-23

中国队锁定冠亚军！王曼昱晋级WTT福冈总决赛女单决赛

11-23

最新画面公开！“飞鲨”家族“三兄弟”实战化训练

11-23

金鸡影后李庚希入主《年会不能停》导演董润年新剧《不讨好的勇气》今晚播出

11-23

王曼昱进WTT总决赛决赛，国乒提前包揽女单冠亚！

11-23

点击查看更多 +

全站最新

周鸿祎论直播带货：反对抢饭碗，倡导向雷军学习新营销

仁神星掩星明晚上演，御夫座恒星将短暂“隐身”奇观待赏

成都市老年人助餐点生态网络建设项目启动探索数字助力社区韧性治理路径

国际金价“五连涨” 金饰价格重回810元之上｜封面财经

赚8千万后被重罚3.35亿 “85”后团伙操纵股价“亏本而归”｜封面深镜

“理响巴蜀”进校园巡回宣讲活动走进四川轻化工大学三位高校宣讲者分享正能量故事

热门内容

本栏最新

国产手机厂商高端市场残酷商战：没有感情，全是兵法

超声波清洗机竟能破碎细胞？揭秘其在生物实验中的特殊应用

人体细胞“户口簿”草图出炉！37.2万亿细胞大揭秘

至少19人食用后患病，美国企业紧急召回近76吨牛肉泥产品

揭秘木星绿色闪电：大气成分与物理过程如何造就这一奇观？

中美6G竞赛白热化，中国领先！马斯克星链能否助力美国弯道超车？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.