ITBear旗下自媒体矩阵:

蚂蚁灵波科技开源LingBot-Depth模型,为智能终端三维视觉感知带来新突破

   时间:2026-01-28 00:02:05 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁集团旗下具身智能公司灵波科技近日宣布开源高精度空间感知模型LingBot-Depth,标志着三维视觉技术领域迎来突破性进展。该模型基于奥比中光Gemini 330系列双目3D相机的原始数据开发,通过融合光学传感与深度学习技术,显著提升了智能终端在复杂环境中的三维空间理解能力,为机器人、自动驾驶等领域提供更精准的视觉解决方案。

在权威基准测试中,LingBot-Depth展现出显著优势。NYUv2室内场景测试显示,其相对误差(REL)较主流模型PromptDA与PriorDA降低超70%;ETH3D稀疏SfM任务中,RMSE误差减少约47%,刷新行业精度纪录。这一成果源于灵波科技研发的"掩码深度建模"(MDM)技术,该技术通过整合RGB图像的纹理、轮廓及环境上下文信息,可智能补全透明玻璃、反光镜面等材质导致的深度数据缺失,输出边缘清晰的三维深度图。

实验数据显示,搭载LingBot-Depth的奥比中光Gemini 330系列相机,在强逆光、复杂曲面等极端光学场景下,深度图完整性较业界领先的ZED Stereo Depth相机提升显著。其输出的三维图像不仅平滑无噪点,物体轮廓边缘锐利度更达到消费级设备新高度。这意味着现有硬件无需升级,即可通过软件优化实现对高反光、透明物体的精准感知。

支撑模型性能的核心是灵波科技构建的千万级真实场景数据库。研发团队采集近1000万份原始样本,筛选出200万组高价值深度配对数据用于训练,同时整合100万组仿真数据增强模型泛化能力。这套包含200万真实世界深度数据和100万仿真数据的核心资产将随模型同步开源,为全球开发者攻克复杂场景空间感知难题提供关键资源。

据透露,奥比中光已与灵波科技达成战略合作,计划基于LingBot-Depth技术推出新一代深度相机产品。本周内,灵波科技还将陆续开源多款具身智能领域的基础模型,持续推动三维视觉技术的开源生态建设。

 
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version