在浦江西岸,一场关于人工智能未来的深度对话正在热烈展开。12月13日至14日,由上海人工智能实验室主办的首届“浦江AI学术年会”汇聚了全球150余名顶尖专家学者,共同探讨人工智能领域的最前沿话题。
近年来,人工智能的发展速度令人瞩目,ChatGPT的横空出世更是掀起了全球范围内的AI热潮。然而,随着技术的不断进步,学界和产业界也开始对AGI(通用人工智能)路线进行更深入的反思和探索。在本次年会上,专家们围绕“公开的高质量数据是否即将用尽”、“不同具身智能技术路线的能力边界”、“AI4S基座模型的需求”以及“大模型是否遭遇瓶颈”等关键问题展开了激烈讨论。
关于“智能”的定义,香港大学计算与数据科学学院院长马毅提出了自己的见解。他认为,当前的深度学习模型,如Transformer,虽然能够给出令人满意的结果,但其决策过程却难以解释和控制,因此并不具备真正的智能。马毅致力于研究“白盒大模型”,试图通过清晰解释模型的压缩过程,从根本上解决当前遇到的“数据墙”和“算力墙”问题。
与此同时,稀宇科技创始人闫俊杰则认为,智能的定义可以更加广泛,黑盒模型在某些应用中已经足够,但白盒模型在理解人类智能方面可能具有优势。他相信,未来将会有更多创新出现,不同研究机构和企业将提出各自对智能的理解,并在特定领域内超越现有水平。
在年会的另一场焦点讨论中,马毅的观点引发了学者们对“Scaling Law(尺度定律)”的深入反思。OpenAI前首席科学家Ilya Sutskever在NeurIPS 2024会议上惊人地宣布,“预训练时代即将终结”,理由是作为AI发展燃料的数据即将枯竭。这一观点在学术界和工业界引发了广泛讨论,人们开始质疑,随着数据枯竭、算力昂贵以及效果下降,Scaling Law是否还能继续支撑AI的发展。
然而,尽管面临诸多挑战,全球顶尖AI公司和科学家们仍在不断探索新的技术路线。阶跃星辰首席科学家张祥雨表示,他对万亿以上参数大模型的能力提升并不绝对乐观,但他对OpenAI和谷歌最近推出的新模型表示赞赏。他认为,虽然这些模型在视觉和推理方面取得了很大突破,但离真正的AGI仍有很长的路要走。
在通往AGI的路线上,上海人工智能实验室主任助理、领军科学家乔宇指出,目前大模型并不具备人类的推理、情感、伦理等战略性思考能力。他认为,应该寻找新的Scaling Law维度,通过更丰富的模型架构和更高效的学习方法来解决当前的问题。同时,他也希望在AGI发展过程中,能有来自中国的核心贡献,找到与中国资源禀赋更加匹配的自主技术路线。
面向未来,中国科学家们正在携手突破新的领域。上海人工智能实验室按照通专融合AGI路径,构建了强推理模型书生InternThinker。该模型解决问题的路径更接近人类学习方式的路径,在面对复杂的推理任务时,能够学习人类的思维模式,快速调整思路,尝试新的解决方案。这一创新在“24点”等高难度数学题以及编程题的解决中展现了卓越的能力。
多模态大模型的发展也备受关注。乔宇希望新的一年中,多模态大模型的涌现能力能够像语言大模型一样取得重要突破。上海人工智能实验室最近发布的书生万象2.5已经在多模态思想链上取得突破,成为首个MMMU测试突破70%的开源多模态大模型。张祥雨同样希望多模态大模型能够实现理解和生成一体化,让Scaling Law重新与智能程度的发展正相关。
最后,本次大会主席、上海人工智能实验室主任、首席科学家周伯文强调,当前大家都在关注“Scaling Law”,但接下来需要思考的是“Scaling What”。他认为,除了算力、数据和推理时间外,提升研究者的“Scale”同样重要。他期待未来能够发挥团队本身的创造力,实现更高层面的协作和创新。