ITBear旗下自媒体矩阵:

谷歌I/O 2025:AI技术大飞跃,智能眼镜将成主流,电影制作迎新变革?

   时间:2025-05-21 09:04:18 来源:钛媒体APP编辑:快讯团队 发表评论无障碍通道

在科技巨头谷歌的年度开发者盛会上,一系列关于人工智能(AI)的突破性进展震撼发布,预示着AI技术正以前所未有的速度重塑我们的生活和工作方式。

谷歌首席执行官桑达尔·皮查伊以一句轻松的开场白拉开了大会序幕,他强调,谷歌正步入一个名为“Gemini时代”的新纪元,在这个时代,最前沿的AI模型不再受传统发布周期的束缚,正以惊人的速度推向全球用户。

皮查伊自豪地宣布,谷歌打破了“性能与价格不可兼得”的行业魔咒。新一代Gemini 2.5 Pro模型在性能飙升的同时,实现了成本的大幅优化。数据显示,Gemini模型每秒生成的输出令牌数已跻身全球前三,而单位计算成本较前代下降了40%。这一突破得益于谷歌第七代TPU芯片的赋能,这款专为大规模推理设计的芯片性能较前代提升了10倍,成为支撑谷歌AI基础设施的“超级引擎”。

技术突破正迅速转化为触手可及的产品体验。谷歌每月通过产品和API处理的AI Token数量从9.7万亿激增至480万亿,增幅超过50倍。开发者生态同样迎来了爆发式增长,超过700万开发者通过Gemini API、Google AI Studio和Vertex AI平台构建应用,其中Vertex AI平台上的Gemini使用量更是飙升了40倍。

在用户端,Gemini应用的月活用户已突破4亿,Gemini 2.5 Pro版本的使用量较前代增长了45%。搜索领域的革新尤为显著,AI概览功能每月覆盖15亿用户,成为全球规模最大的生成式AI应用场景。皮查伊透露,谷歌搜索的“下一站”将是AI驱动的交互模式升级,用户将体验到更自然、更个性化的信息获取方式。

谷歌还展示了三个将实验转化为产品的研究项目。其中,Project Starlight的3D视频技术正式落地为全新平台Google Beam,该平台通过6摄像头阵列捕捉用户动作,结合AI生成3D光场显示,实现毫米级头部追踪和60帧实时渲染。现场演示了与惠普合作设备的沉浸式通话效果,并宣布首批测试设备将于年内推出。

另一个项目是Project Astra,作为实时语音翻译技术的集大成者,Google Meet现已支持英语与西班牙语的即时互译,并计划在未来几周扩展至更多语种。演示中,系统精准还原了演讲者的语气、节奏甚至表情。

Project Marina定位为“网络交互智能体”,已具备多任务处理和教学-重复学习能力。皮查伊展示了其如何同时管理10项任务,并通过一次演示学习完成复杂操作。该技术将通过Gemini API开放给开发者,预计夏季面向更广泛用户推出。

皮查伊将智能体(Agent)视为AI技术的“下一形态”。他现场演示了Gemini应用中的“代理模式”:用户只需设定需求,系统即可自动调用Project Marina完成房源筛选、预约看房等操作,用户全程无需介入。这一功能将率先向订阅用户开放。

Gemini 2.5 Pro经过优化,在自然语言理解、代码生成、复杂推理及多模态处理(图像/视频)等领域全面突破性能边界。而轻量化模型Gemini 2.5 Flash则以更快的推理速度和更低的资源消耗,提供与Pro相近的能力,计划6月率先开放开发者接入。

本次升级的最大亮点在于原生多模态能力落地,包括全新的文本转语音(TTS)技术支持24种语言无缝切换,以及用户仅需上传草图并输入提示词,系统即可在数十秒内自动解析图像、生成可交互的3D模型并部署上线。

谷歌还展示了“Gemini Life”场景,用户维修自行车时,AI可同步调取说明书、分析故障视频、搜索教学资料、联系配件供应商,甚至通过语音交互协调维修流程。这种跨模态、主动式服务模式,预示着AI将从被动工具进化为能自主规划、串联任务的“数字伙伴”。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version