近日,科技领域掀起新一轮竞争热潮,埃隆・马斯克旗下的xAI公司正全力投入“世界模型”的研发,与meta、谷歌等科技巨头一同争夺下一代人工智能系统的制高点。这类系统具备自主导航和设计物理环境的能力,被视为AI技术的重大突破。
根据英伟达的介绍,世界模型是一种生成式AI模型,能够捕捉现实世界的动态特征,包括物理属性和空间关系。它通过整合文字、图像、视频和动作等输入数据,生成逼真的动态影片。与传统大语言模型主要依赖文本训练不同,世界模型通过学习视频和机器人数据,更深入地理解现实世界的运作机制。
xAI公司已从英伟达挖来两位关键人才——泽尚・帕特尔和何宜晖,这两位研究员在世界模型领域拥有丰富经验。英伟达凭借其Omniverse平台,在该技术领域长期保持领先地位。此次人才流动,显示出xAI加速布局的决心。
知情人士透露,xAI研发的世界模型将首先应用于游戏领域,用于生成可交互的3D环境。未来,这类模型还有望扩展至机器人AI系统,推动实体产品与AI的深度融合。一些科技公司认为,世界模型可能成为连接软件与实体产品的桥梁,例如人形机器人。
英伟达此前对媒体表示,世界模型的潜在市场规模可能接近当前全球经济总量。这一预测引发了行业对技术商业化的广泛讨论。与此同时,马斯克在社交平台X上宣布,xAI计划在明年年底前推出一款由AI生成的优秀游戏,重申了去年设定的目标。
本周,xAI推出了最新的图像和视频生成模型,并宣布该模型已完成“重大升级”,同时免费向用户开放。这一举措被视为xAI在生成式AI领域的重要布局。
与传统视频生成模型(如OpenAI的Sora)不同,世界模型能够实时理解物理世界的因果关系,掌握物体在不同环境中的互动机制。这种能力使其超越了单纯依赖训练数据预测的模式,为AI技术开辟了新的可能性。
然而,世界模型的研发面临巨大挑战。数据获取是首要难题,模拟现实世界并训练模型需要海量且高质量的数据,成本高昂。技术实现的复杂性也增加了研发难度。
游戏行业对AI技术的应用存在不同声音。《博德之门3》开发商拉瑞安工作室的发行主管迈克尔・道斯在社交平台X上直言,AI无法解决游戏行业的“重大问题”,即“领导力与远见的缺失”。他强调,行业需要的是更具沉浸感的世界呈现方式,而非算法生成的玩法循环。
目前,xAI、谷歌和meta等公司均在世界模型领域投入大量资源。尽管技术前景广阔,但如何克服数据和技术瓶颈,仍是行业共同面临的课题。截至发稿,xAI及相关人士尚未对此置评。