随着人工智能领域的激烈竞争逐渐进入白热化阶段,中国的大模型市场正经历一场前所未有的变革。2024年成为了分水岭,大厂与创业公司纷纷在技术、产品、商业化及生态建设上采取了不同战略,标志着“百模大战”的时代已经落幕。
在这场竞赛中,创业公司展现出了多样化的选择。估值超过200亿人民币的五家大模型公司中,百川智能已将重心转移至行业大模型,如医疗领域;月之暗面与MiniMax则优先发展C端产品与应用;而智谱与阶跃星辰依旧坚持向AGI(通用人工智能)大模型发起冲击。估值较低的二线大模型公司也早已转向,深耕垂直细分领域。
与此同时,国内外多家大模型如Claude 3.5 Sonnet的发布,标志着性能的大幅提升,部分指标甚至超越了GPT-4,OpenAI的领先地位受到挑战。大模型正逐渐成为一种“电力”资源,成为推动各行各业发展的核心动力。一家专注于AI代码生成的创业公司表示,如今他们可以在应用开发中接入多个底层模型,根据产品需求调用不同模型的优势,例如编写代码时调用Anthropic,指令遵循时则选择OpenAI。
在此背景下,大模型市场呈现出三层商机:底层基座模型提供商(类似发电厂)、中间云厂商(类似国家电网)、以及上层AI软硬产品应用(如电冰箱、电风扇等电子产品)。对于创业公司而言,由于资金、人才与资源的限制,大多只能选择两个战场,甚至只能押注一个赛道。而基座模型训练的难度和资源要求极高,使得创业公司的机会更多集中在应用层,包括AIGC软件应用和AI智能硬件。
2024年,OpenAI继续发布新模型,但GPT-5的迟迟未公布,加上核心人才的流失,使得下一代基座大模型的发展充满变数。推出下一代基座大模型的公司可能不再局限于OpenAI,而是扩展到更多具备顶尖人才团队、充足资金和大量训练数据的公司。高质量训练数据的获取方式包括仿真合成、用户交互和真实世界数据收集等。
据行业人士透露,下一代基座大模型的训练成本将是天文数字。尽管有报道称DeepSeek V3的训练成本不到600万美元,但行业普遍认为,下一代基座大模型的训练成本将远超这一数字。OpenAI训练GPT-5的算力成本就高达5亿美元,这进一步凸显了大模型市场的资金门槛。
在国内大厂中,百度凭借在基座模型上的领先地位,以及阿里、字节的积极投入,成为有望竞争下一代基座大模型的主要玩家。2024年,阿里旗下的AI应用通义正式从阿里云分拆,开始在C端发力;字节则重金招募人才,并在豆包推广上投入大量预算;百度则在行业大模型与C端应用上共同发力,实现了多个场景的商业化验证。
大厂们在大模型市场的布局各具特色。百度在基座模型层投入坚决,团队稳定;阿里和字节在文本、图文或视频等领域存在资源竞争和团队竞争,采用赛马制。在云服务层,火山引擎绑定豆包与即梦,同时获取其他创业公司的基座模型授权;百度重点打造头部国央企客户,已有六成在使用其AI服务;阿里云则通过投资并购,积极扩张。
在应用层,百度与阿里同时发力B端和C端。百度与行业头部客户共创行业大模型,C端则有AI搜索、文库、网盘等业务;阿里则以夸克搜索、通义App为主要抓手。百度、阿里、字节都使用自家基座大模型升级内部产品,其中百度更是注重业务重构。字节则主要聚焦在多模态C端应用开发,发力豆包、即梦、剪映等。
百度在竞争下一代基座模型上展现出较高的胜率。其算法积累时间长、技术系统完善、团队人才资深稳定、资金雄厚,决定了百度可能是接下来极少数能够推出下一代基座大模型的中国公司之一。百度在深度学习和大模型领域的专利申请数量位居全球第一,也为其在竞争中提供了有力支持。
百度在战略优先级上的坚定也为其赢得了优势。2024年,全球已有多家公司宣布退出或减少大模型的预训练投入,但百度仍在继续投入预训练,并预计在2025年初推出下一代文心大模型。百度从2010年前后开始全力转向人工智能,多年来一直将超过收入所得的20%用于人工智能等技术的研发,研发占比远超其他同规模大厂。
百度在C端AI应用上的发展也令人瞩目。以百度文库为例,其在国内的付费用户已经突破4000万,AI功能的月活跃用户数已超过9000万,仅次于ChatGPT。百度C端产品的先发优势持续起作用,对用户心智的抢先占领决定了市场份额。在付费情况下,用户极少会更换产品使用,这也为百度在C端应用上的优势提供了有力保障。
高质量训练数据的匮乏已成为下一代基座大模型训练的重要影响因素之一。GPT-4的参数规模是1.6-1.7T,行业猜测GPT-5的参数可能是10T以上,所需数据量大约是现有的8倍以上。百度在数据方面的优势包括搜索引擎带来的大规模中文数据、智能云积累的企业场景数据、C端应用产生的用户交互数据以及自动驾驶产生的高质量多模态数据等。
在中间层的算力与API服务方面,百度也展现出了强劲实力。飞桨平台为文心大模型提供高效的训练和推理支持,为开发者提供完整工具链和开发环境。百度自建数据中心和AI专用加速硬件,增强了技术自主性,能够很大程度上规避外界因素的影响。
随着2025年的到来,中国大模型市场将进入快速的洗牌期。更多创业公司可能在下一代基座模型竞争中退场,而百度、字节、阿里等大厂则有望稳坐“大模型牌桌”,开启全新的竞争格局。