谷歌即将推出新一代大语言模型Gemini 3.5 Pro,但这一消息并未引发市场如预期般的热烈反响。相反,这款新模型正面临定价更高、内容审核更严的双重压力,而其在编程能力上的短板更成为外界关注的焦点。
在近期举行的谷歌I/O开发者大会上,CEO劈材宣布Gemini 3.5 Pro将于下月发布,但现场观众反应平淡。尽管谷歌在数学推理和世界知识领域保持领先地位——Gemini 3.1 Deep Think在高级数学证明中表现卓越,DeepSeek测试也显示其在世界知识方面独占鳌头,但这些优势未能掩盖其在编程领域的明显不足。
据内部测试反馈,Gemini 3.5 Pro在处理长文本和高复杂度任务时频繁出现"消极怠工"现象,甚至被爆出"摸鱼"行为——不深入思考直接给出无用回应。更严重的是,该模型在AI编程中存在致命缺陷:其自动重写代码功能过于激进,导致用户审阅时因提问被覆盖,拒绝修改则会丢失全部已生成代码。与之形成鲜明对比的是,竞争对手Opus 4.6仅需一次上下文输入即可完成分析,全程尊重用户代码状态。
劈材公开承认谷歌在AI编程领域落后于OpenAI和Anthropic,尤其在处理复杂软件任务时存在差距。尽管他强调模型使用量每周翻倍、75%新代码由AI生成,但谷歌内部员工却用反AI表情包表达不满,嘲讽自研工具Jetski制造"垃圾代码"。这种矛盾态度折射出公司内部对AI编程工具的实际体验存在严重分歧。
新模型并非没有亮点。相比前代,Gemini 3.5 Pro在视觉能力、图像生成、SVG生成质量及多模态理解方面均有显著提升,上下文窗口可能扩展至200万token。但这些改进伴随着更严格的内容过滤机制,而爆料显示其定价将高于Gemini 3.1 Pro。在OpenAI和Anthropic加速迭代、模型性能持续领先的背景下,谷歌的定价策略和市场定位面临严峻考验。
当前AI行业正步入"边际效应递减"阶段,单纯依靠算力堆砌已难以实现突破性进展。谷歌的困境折射出整个AGI领域面临的共同挑战:昂贵的算力成本、狭窄的安全边界,以及模型在物理极限下的性能妥协。这场技术竞赛的下一阶段,或将取决于企业如何在性能提升与成本控制之间找到平衡点。













