中国人工智能领域迎来新动态,两家处于行业领先地位的大模型企业近期动作频频,引发市场广泛关注。
据可靠消息,DeepSeek于9月29日通过公告形式宣布,其最新研发的DeepSeek-V3.2模型已正式上传至国际知名社区平台HuggingFace。这一举动标志着该企业在模型迭代方面持续保持高速发展态势。值得注意的是,该企业此前在8月发布的DeepSeek-V3.1版本已展现出显著技术突破,其混合推理架构支持同时运行思考模式与非思考模式,在保持高效运算的同时,将思考效率较前代提升显著,特别是在智能体任务处理方面,通过后训练优化实现了工具调用能力的质的飞跃。
另一家行业巨头智谱同样动作不断。继7月推出专为智能体应用打造的GLM-4.5基础模型后,该企业于8月再次发布重磅产品——全球首个参数规模达106B的开源视觉推理模型GLM-4.5V,其中激活参数达12B,在百亿级参数模型中展现出顶尖性能。最新消息显示,其新一代模型GLM-4.6即将面世,目前已有部分用户通过API接口获得提前调用权限,这预示着该企业在多模态处理领域将实现新的跨越。
从技术演进路径观察,两家企业呈现出差异化竞争态势。DeepSeek持续深耕推理架构创新,通过模块化设计实现不同运算模式的灵活切换;智谱则更注重模型能力的原生融合,其GLM-4.5系列首次在单模型中集成推理、编码与智能体三大核心能力,这种技术路线选择反映出两家企业对AI应用场景的不同理解。
行业分析师指出,当前大模型竞争已进入深水区,企业不仅需要持续突破技术瓶颈,更要构建完整的生态体系。DeepSeek与智谱的最新进展表明,中国企业在模型迭代速度和应用场景拓展方面已形成独特优势,这种技术竞赛将推动整个行业向更高水平发展。