在科技界万众瞩目的焦点中,今年12月成为大模型行业发展的一个高潮阶段。与去年相比,今年各大科技公司不仅技术层面更加成熟,市场心态也更加积极。
自11月中旬起,OpenAI、微软、谷歌、字节跳动、百度及智谱等科技巨头纷纷召开大模型相关发布会,推出了一系列创新模型、应用及产品。其中,OpenAI更是以12天连续直播的形式,开创了科技公司发布会的新纪元。
在这场技术盛宴中,最为引人注目的莫过于OpenAI推出的o1和o3模型,它们引发了业界对于推理AI的激烈竞争。据OpenAI发布的评测数据,o3在复杂问题如数学、编码及博士级科学问题上的表现极为出色,尤其是在EpochAI Frontier Math这一由60余位全球数学家共同推出的数学基准测试中,o3创造了25.2%的准确率新高,远超其他模型。而在o3发布之前,国内外科技公司如谷歌、阿里云及月之暗面等,都以追赶o1为目标,纷纷推出了自己的数学推理模型。
然而,尽管o3等推理模型展现出强大的能力,但它们是否能为普通用户带来实质性帮助,目前仍存疑。这些模型更适合于编码、数学及科学领域的研究人员,且成本高昂。不过,也有专家预测,随着技术的不断进步,未来推理成本有望快速降低。
除了技术层面的竞争,大模型行业的价格战也愈演愈烈。继今年5月和9月的两轮降价后,OpenAI和字节跳动旗下的火山引擎再次掀起了第三轮价格战。OpenAI针对GPT-4o音频模型大幅降价60%,而火山引擎则将视频模型的价格降低了85%,打响了视觉理解模型的“厘时代”。这一轮价格战不仅吸引了更多开发者,也加速了AI技术在外部企业的应用。
随着计算成本的下降和基础模型选项的增加,大模型应用层迎来了飞速发展。初创公司可以灵活选择流行的方案,通过“鸡尾酒打法”将通用大模型与垂直小模型结合,优化功能、结果及成本。国内外大厂也纷纷布局AI Agent和AI搜索等应用方向,探索大模型的商业化路径。
其中,AI Agent以其交互性、自动化和主动性等特点,成为12月最火的应用落地方向。国内外科技大厂纷纷推出自己的Agent平台,展示了大模型在工作和生活中的广泛应用潜力。然而,尽管AI Agent前景广阔,但目前仍面临商业模式、现实世界数据收集及领域认知架构编码等挑战。
在资金方面,大模型行业呈现出明显的分化趋势。一方面,OpenAI、Anthropic等头部公司频获巨额融资,估值飙升;另一方面,初创公司则面临融资难、生存难的困境。风险机构预测,未来“富人”和“穷人”之间的分化将更加显著,大型科技公司和头部企业的整合速度将加快。
与此同时,大模型行业的人才流动也成为年末的焦点话题。不少大模型公司的员工选择离职,回流大厂或再创业。而OpenAI等头部公司也面临着人才流失的困扰。随着竞争的加剧,组织和人才的整合与分化将成为常态。
尽管大模型行业仍面临诸多挑战和不确定性,但不可否认的是,AI技术已经深入人们的生活,并正在改变着世界。正如OpenAI在12天直播发布会后所言:“你可以直接去做事情了。”