在ChatGPT上线两周年之际,大型语言模型领域的竞争愈发激烈。字节跳动旗下的火山引擎推出了豆包视觉理解模型,专注于教育、旅游和电商三大应用场景,并宣布将每千个tokens输入的价格降至0.003元,降幅高达85%,标志着视觉AI进入“厘时代”。
与此同时,大洋彼岸的OpenAI推出了视频大模型Sora,但很快由于需求过高导致ChatGPT全球范围内宕机。苹果在新版本中也加入了ChatGPT的应用,Siri开始真正调用ChatGPT。作为竞争对手,谷歌发布了最新AI模型Gemini 2.0,多模态能力得到进一步提升,其智能助手Astra可以调用谷歌搜索和识图等应用来完成任务。
ChatGPT的周活跃用户在2024年末突破了3亿,并朝着10亿的目标迈进。然而,成本压力已经显现,ChatGPT推出了不同版本的付费模式。在中国市场,2024年的竞争态势已经明显分化。
字节跳动与阿里巴巴在大模型领域的竞争尤为激烈。两者在人才争夺上尤为明显。去年,阿里投资了多家大模型创业公司,而字节跳动则选择亲自下场,布局从模型到应用的市场。今年,阿里通义千问大模型技术负责人周畅离职后加入字节跳动,负责AI大模型相关工作,阿里方面则以违反竞业协议为由起诉周畅。字节跳动在大模型领域的人才招聘上也表现出强劲势头,成为新发大模型岗位量最多的企业。
除了人才争夺,两者在技术和应用场景上的竞争也愈演愈烈。字节跳动通过火山引擎和豆包大模型,与阿里的通义千问和阿里云形成了直接对标。阿里云CEO吴泳铭曾透露,预计2025财年下半年,阿里云将恢复两位数的收入增长,其中AI相关产品是推动增长的重要动力。
腾讯与百度则代表了开源与闭源两种不同的大模型发展路径。百度是国内大厂中最先发布大语言模型的公司,而腾讯则是起跑最晚的一个。然而,在今年,两者在技术升级和场景拓展上都取得了显著进步。百度文库经过大模型重构后成为“一站式AI内容获取和创作平台”,而腾讯的混元大模型也在微信搜一搜等场景中发挥了重要作用。
尽管两者在技术和应用场景上都有所突破,但在商业化方面仍然面临挑战。百度在财报会上提到,AI搜索商业化仍处于早期阶段,短期内百度并不急于商业化。腾讯同样对混元大模型嵌入商业化搜索结果的做法持否定态度,主要任务仍然是吸引用户。不过,腾讯在大模型领域的发布动作不断,推出了新一代万亿参数大模型“混元Turbo”以及多款开源大模型。
对于大模型创业公司而言,2024年是充满挑战的一年。多家大模型创业公司遭遇了核心成员离职、股东仲裁等风波。同时,行业进入了理性周期,大模型创业公司不得不走上差异化的道路。
例如,月之暗面一直在卷技术,推出了Kimi探索版和推理模型上的两个进化版本;智谱AI则专注于B端定制化项目;百川智能则在医疗领域深耕。尽管这些大模型独角兽在各自领域取得了显著成绩,但与互联网大厂们的同场竞技仍然是一场残酷的淘汰战。
在这场大模型竞争中,创新加速度、人才密度、技术实力以及应用场景的拓展都成为了关键因素。随着竞争的深入,谁将脱颖而出,谁又将掉队,仍然是一个未知数。