在科技界的瞩目之下,一项颠覆性的创新成果由李飞飞领衔的团队悄然发布。作为空间智能领域的首次尝试,该项目成功实现了仅凭一张图片,即可自动生成一个具备高度交互性的3D游戏世界。
这一突破性技术的核心在于,用户不仅能够观赏到这个由AI生成的3D世界,更能如同置身于真实的游戏环境中,自由移动相机,探索每一个角落。浅景深、希区柯克变焦等电影级别的视觉效果,也均在这个虚拟世界中得以实现。
通过输入任意一张图片,AI系统能够在此基础上构建出一个完整的3D世界。这个世界中的一切元素,除了输入图片本身的内容外,均由AI自动生成。用户可以在这个虚拟空间中自由漫步,观察每一个细节,甚至改变物体的颜色、调整背景光影,或是插入其他对象。
与传统生成模型不同,这一AI系统直接预测3D场景,而非简单的像素。这意味着生成的3D世界在用户移开视线后再度返回时,仍会保持原样,且遵循基本的3D几何物理规则。这一特性使得虚拟世界具备了更强的真实感和持久性。
网友们对这一成果的反应异常热烈,评论区充斥着“难以置信”的赞叹。Shopify创始人Tobi Lutke等业界知名人士也纷纷点赞,认为这一技术为VR领域打开了全新的可能性。
李飞飞本人也在第一时间分享了这一成果,并表示:“无论怎么理论化这个想法,用语言很难描述通过一张照片或一句话生成的3D场景互动的体验。希望大家喜欢。”目前,该技术的候补名单申请已经开启,部分内容创作者已经开始尝试使用这一技术。
World Labs团队表示,这一3D世界生成技术不仅限于观赏,更能够与多种AI工具相结合,为创作者们提供全新的工作流体验。例如,可以先使用文生图模型从文本生成图像,再将这些图像转化为3D世界,从而在不同的风格下创造出独特的虚拟空间。
该技术还能够以全新的方式体验经典的艺术作品。通过输入一张艺术品的图片,AI系统能够补全原图未展示的部分,并将其转化为可互动的3D世界。例如,梵高的《夜晚露天咖啡座》和爱德华·霍普的《夜行者》等作品,都得以在这个虚拟世界中以全新的面貌呈现。
World Labs由斯坦福大学教授李飞飞在今年4月创立,专注于空间智能领域的研究。该公司旨在通过视觉化为洞察、看见成为理解、理解导致行动的理念,解决人工智能领域的难题。短短数月内,公司便突破了10亿美元的估值,成为新晋独角兽。
随着空间智能技术的不断进步,World Labs计划将这一技术应用于更多领域,包括视频游戏开发、电影制片等。同时,他们还在开发一系列针对艺术家、设计师、开发人员、电影制作人和工程师等专业人士的工具,以推动这一技术的广泛应用。