在ChatGPT上线两周年之际,大模型技术的竞赛依然如火如荼,各大企业和创业公司纷纷加速布局,力求在这一领域站稳脚跟。
字节跳动旗下的火山引擎再次以价格战为策略,推出了豆包视觉理解模型,主要针对教育、旅游和电商三大应用场景。其价格极具竞争力,每千个tokens输入的成本仅为0.003元,较行业平均水平降低了85%,标志着视觉AI领域进入了一个新的低成本时代。
与此同时,大洋彼岸的OpenAI也发布了视频大模型Sora,但迅速因需求过高导致ChatGPT全球范围内的宕机。苹果也在新版本中让Siri正式接入了ChatGPT。面对竞争,谷歌不甘示弱,发布了最新AI模型Gemini 2.0,多模态能力大幅提升,其智能助手Astra更是可以调用谷歌搜索和识图等应用,以更高效地完成任务。
ChatGPT的用户数量在2024年底已突破3亿,并朝着10亿的目标迈进。然而,随着用户规模的扩大,成本压力也逐渐显现,迫使ChatGPT推出了不同版本的付费模式。
在中国市场,2024年的竞争态势已经出现了明显的分化。首先,大模型人才的争夺异常激烈,特别是在字节跳动和阿里巴巴等大厂之间。字节跳动通过招揽包括原零一万物核心成员黄文灏、面壁智能核心成员秦禹嘉等在内的众多人才,显著增强了其大模型团队的实力。而阿里巴巴则通过投资多家大模型创业公司,如月之暗面、智谱AI等,来扩大其在大模型领域的布局。
在技术和应用场景方面,各大厂商也在加速追赶。字节跳动的豆包大模型与火山引擎的组合,直接对标阿里巴巴的通义千问与阿里云。两者都瞄准了B端市场的未来,致力于通过提供高效、稳定的AI基础设施和丰富的应用场景来赢得市场份额。
腾讯和百度则代表了开源与闭源两种不同的大模型发展路线。百度是国内最早发布大语言模型的大厂之一,而腾讯则起步较晚。然而,在过去的一年里,两者都在技术升级和场景拓展上取得了显著进展。百度文库的AI重构和腾讯混元大模型在微信搜一搜等场景中的应用,都展现了AI技术对传统业务的赋能作用。
尽管各大厂商都在加速布局大模型领域,但创业公司的道路却显得更为艰难。在估值达到两百亿美元水平的同时,它们也不得不面对行业进入理性周期的现实。为了生存和发展,这些创业公司纷纷走上了差异化的道路,有的专注于特定应用场景的定制化项目,有的则在海外市场寻求突破。
然而,在这场激烈的竞争中,并非所有参与者都能笑到最后。一些创业公司因为资金链断裂、人才流失或技术瓶颈等问题而陷入困境。而大厂之间也面临着激烈的竞争和不断变化的市场环境,需要不断调整策略以保持领先地位。
尽管如此,大模型技术的未来发展依然充满无限可能。随着技术的不断进步和应用场景的不断拓展,AI大模型将在更多领域发挥重要作用,为人类社会带来更加便捷、高效和智能的生活方式。