ITBear旗下自媒体矩阵:

杭州群核科技开源SpatialLM,空间理解模型引领具身智能新潮流

   时间:2025-03-28 11:54:24 来源:钛媒体APP作者:ITBEAR编辑:快讯团队 发表评论无障碍通道

在科技界的最新动态中,群核科技,被誉为杭州“六小龙”之一的创新企业,在GTC2025全球大会上悄然发布了一款名为SpatialLM的空间理解模型,引起了国际技术界的广泛关注。

SpatialLM是一款基于大语言模型的创新框架,它能够从视频输入中精准捕捉并理解对应的空间点云数据。通过复杂的推理过程,该模型能够对点云数据进行深入的场景描述,并将分析结果以自然语言的形式直观呈现。这一突破性的技术,不仅提升了机器对物理世界的理解能力,还拓宽了人工智能技术的应用边界。

SpatialLM的工作原理令人印象深刻,其推出后迅速在国际社交媒体和技术论坛上获得了热烈反响。在HuggingFace趋势榜上,SpatialLM迅速攀升至第二位,与来自杭州的Deepseek和通义千问Qwen2.5-Omni一同占据了榜单的前三甲,超越了英伟达和谷歌等科技巨头的模型。

群核科技的创始人黄晓煌在接受国际知名媒体彭博社采访时坦言,开源SpatialLM的目的是为了加速具身智能技术的突破。这一举动不仅彰显了群核科技在技术创新上的自信,也体现了其推动行业发展的责任感。

与传统的大语言模型相比,SpatialLM在理解物理世界的几何与空间关系方面取得了显著进展。它不仅突破了以往模型的局限,还赋予了机器类似人类的空间认知和解析能力。目前,SpatialLM已在HuggingFace、GitHub和魔搭社区等平台向全球开发者开放,为具身智能领域的企业和科研机构提供了一个强大的基础训练框架。

SpatialLM在输入方式上更具通用性。与meta此前发布的依赖特定设备的Scene模型不同,SpatialLM能够接收普通相机和手机拍摄的视频作为输入,从而大大降低了使用门槛。SpatialLM还使用大语言模型进行输出,能够生成对3D场景的自然语言描述,并有望在未来支持原生自然语言与场景数据的交互。

更重要的是,SpatialLM能够认知和理解物理世界中的空间信息,并进行结构化描述。这得益于群核科技在物理空间模拟技术领域的深厚积累。过去十余年间,群核科技积累了海量的三维数据和空间认知数据,这些数据为SpatialLM的训练提供了坚实的基础。因此,SpatialLM不仅具备创建物理正确的空间场景的能力,还能够为具身智能企业提供高效、低门槛的训练解决方案。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version