在AI领域,一场关乎基础大模型的隐形战役正在激烈上演。尽管AI应用遍地开花,但大模型之战非但没有平息,反而愈演愈烈。
据统计,自2025年初以来,中国的大模型市场见证了百度、字节、阿里、DeepSeek及“六小虎”等重量级玩家推出了超过45款基础大模型,平均每3.3天就有新款问世。这一速度不仅未减,反而呈现出愈发激烈的态势。
上半年,国内大模型的第一梯队格局悄然向海外“五强”——OpenAI、Google、Anthropic、X.AI与meta靠拢。国内方面,阿里、字节、DeepSeek、阶跃星辰与智谱组成了“3+2”的“新基建五强”,引领行业潮流。
上半年,基础大模型领域高手如云,竞争异常激烈。“新基建五强”共发布了32款大模型,其中阿里与阶跃星辰尤为突出,分别发布了9款与11款,占据了半壁江山。
从行业趋势来看,开源、推理与多模态成为三大关键词。阿里作为开源领域的佼佼者,自2023年起便将多款模型推向开源社区,成为多个领域的开源SOTA提供者。其混合推理模型Qwen3更是以低成本高效能,成为全球最强的开源模型之一。
DeepSeek则以推理大模型见长,其发布的DeepSeek R1以极低成本实现高性能,成为推理大模型的标杆。相比之下,DeepSeek专注于单一领域,不做大模型矩阵。
多模态大模型成为今年的研发重点。阶跃星辰被誉为“多模态卷王”,已发布22款基础模型,其中16款为多模态领域。其开源的文生视频大模型Step-Video-T2V,一度成为全球范围内参数量最大、性能最优的开源视频生成大模型。
字节则在多模态领域奋起直追,其文生图模型Seedream 3.0不仅在画质与生成效率上有所提升,更在商业化应用上展现出强大实力。然而,相较于大语言模型,多模态大模型的发展仍显不足,尚未迎来“GPT-4时刻”。
在AI应用如火如荼、Scaling Law边际效益递减的背景下,基础大模型的未来价值何在?DeepSeek的崛起无疑给出了肯定答案。行业变化日新月异,新模型与新产品的发布不断刷新认知。为了在竞争中立于不败之地,大厂与创业公司纷纷加大投入,抢钱、抢人才成为主旋律。
算力、人才与资金是衡量大模型公司实力的三大硬指标。大厂资金雄厚,而创业公司则需依赖投资。智谱与阶跃星辰作为被国资看好的企业,在寒冬期持续获得资本青睐。人才争夺战也在上演,“新基建五强”展现出强大的虹吸效应。
在资金与人才的双重加持下,“新基建五强”逐渐建立优势。阿里以生态拉拢B端用户,字节则通过应用反哺模型升级,DeepSeek凭性价比称王,智谱在政企端优势明显,阶跃星辰则凭借多模态实力脱颖而出。
商业化方面,开源与垂类场景应用成为两大关键方向。开源的中国大模型已占据全球半壁江山,HuggingFace上前30的热门模型中,有12个来自中国。开源之后,商业化手段更加多样,API调用付费、云服务及定制化服务成为主要模式。
垂类场景应用同样火热,智能体(Agent)成为热门方向。从政企、金融到医疗,智能体无处不在,尤其在智能终端结合方面展现出巨大潜力。长城汽车CTO吴会肖指出,汽车因其高价值软硬件系统与用户紧密联系,成为理想的AI载体。同样,手机、具身智能等产品也备受青睐。
智能体+智能终端的合作模式备受追捧。阶跃星辰与智谱等公司在智能终端赛道上展开激烈竞争,与OPPO、吉利等厂商达成合作。智能体能力的叠加成为智能终端产品的卖点,如OPPO手机Find N5与Find X8的销量便因搭载智能功能而亮眼。
相较于传统ToB赛道的私有化定制,大模型公司更倾向于借助技术红利,将产品标准化,以实现更高的毛利率。无论是提供开源工具的“自助火锅店”,还是垂类智能体的“私房菜餐厅”,大模型商业化的前景均愈发乐观。
在AI大模型公司竞相布局的当下,开源与垂类场景应用成为推动商业化进程的关键力量。随着技术的不断演进与市场的日益成熟,大模型公司的未来值得期待。