在人工智能领域,李飞飞的名字始终与突破性进展紧密相连。这位被业界誉为“AI教母”的科学家,近期因提出“空间智能”概念再次引发全球科技界热议。她认为,若人工智能无法理解物体的深度、距离、遮挡与重力等空间关系,就永远无法实现真正的“具身”智能。这一判断源于她对生物视觉系统的长期研究,也与她少年时期在野外徒步时对自然世界的深刻感悟密不可分。
李飞飞的学术生涯始于对计算机视觉的探索。在加州理工学院攻读博士学位期间,她突破传统研究范式,同时涉足神经科学与计算科学两大领域,试图解开“如何让机器像人类一样看世界”的难题。当时,计算机视觉研究主要依赖手工设计的特征和小规模数据集,机器能识别的物体种类极为有限。李飞飞却提出一个大胆设想:构建一个涵盖全球所有物体的百万级图像数据库。这一想法在2005年前后被视为天方夜谭,彼时学术界正陷入“人工智能寒冬”,研究资金匮乏,她的团队甚至面临资金链断裂的危机。
转机出现在亚马逊众包服务的出现。通过这一平台,李飞飞团队以低成本召集全球网民参与图像标注,最终在2009年完成ImageNet数据库的构建。该数据库包含320万张标注图片,覆盖5247个类别,为计算机视觉研究提供了前所未有的数据基础。2012年,基于ImageNet预训练的AlexNet模型在视觉识别挑战赛中以绝对优势夺冠,将错误率从26%降至15%,这一突破被视为人工智能黄金时代的开端。ImageNet的开放共享模式,更推动了全球AI研究的范式转变。
从学术研究到产业应用,李飞飞的路径始终充满挑战。2017年,她暂别斯坦福大学,加入谷歌云担任AI/ML首席科学家,主导制定人工智能战略方向。这段经历让她深刻认识到技术落地面临的“水土不服”问题:实验室中的突破性成果,往往需要经过漫长调整才能适应真实场景需求。这种认知,为她后续提出“空间智能”概念埋下了伏笔。
2024年,李飞飞创立World Labs,正式开启空间智能研究。她将空间智能定义为“支撑人类认知的脚手架”,认为现有大语言模型虽能处理语言信息,却无法理解三维空间中的物理规律。她以苍蝇为例:这种昆虫没有万亿级参数,却能在复杂环境中精准避障,这得益于其与生俱来的空间感知能力。李飞飞团队目前研发的“世界模型”Marble,正是试图通过生成三维空间数据,让AI获得类似的空间理解力。
这项研究面临的技术挑战巨大。生成三维空间需要处理海量参数,现有算法在效率与精度上仍存在瓶颈。李飞飞坦言,当前技术仍处于早期阶段,但ImageNet的成功经验让她保持耐心。她将通用人工智能(AGI)比作一扇需要多把钥匙开启的门,空间智能正是其中关键一把。这种认知,源于她对生物进化史的深入研究——寒武纪生命大爆发中,视觉系统的出现推动了生物智能的飞跃,这一历史规律或许能为AI发展提供启示。
李飞飞的科研生涯始终贯穿着对行业盲点的敏锐洞察。从突破数据瓶颈到重新定义智能边界,她的每一次选择都源于对科学本质的思考。在自传《我看见的世界》中,她详细记录了从成都少女到AI领军人物的成长轨迹:16岁随父母移民美国时,全家仅靠20美元维持生计,她白天在餐馆打工,晚上挤时间学习,最终以全额奖学金进入普林斯顿大学。这段经历塑造了她对科学纯粹的热爱,也让她在面对质疑时始终保持坚定。正如她所言:“科学探索没有终点,我们永远在接近真理的路上。”













