社交媒体X上的一则关于“未来AI竞争趋势”的推文,近日吸引了科技巨擘马斯克的注意,并收获了他的亲自点赞。巧合的是,马斯克旗下的xAI公司恰好在同一周发布了其最新的Grok 3大模型。
这则推文由美国TMT领域知名投资人Gavin Baker发表,他对AI行业的深刻见解获得了马斯克的认可,后者评论道:“见解独到”。那么,让我们深入探究一下,Baker究竟提出了哪些引人深思的观点。
首先,Baker断言,AI产业的格局正经历前所未有的快速变革,OpenAI曾一度占据的领先地位或将面临严峻挑战。他指出,未来AI竞争的核心将聚焦于数据,那些无法获取独特且有价值数据的前沿模型,其贬值速度将是史无前例的。在此背景下,拥有数据垄断优势的巨头如谷歌、meta等,将构筑起难以逾越的“护城河”。
具体而言,从2022年夏季至2024年春季,OpenAI凭借其先发优势和对“缩放定律”的坚定押注,主导了AI领域逾七个季度。缩放定律,即模型性能与其规模、训练数据集大小及计算资源之间的可预测关系,被视为大模型预训练的第一性原理。
然而,Baker强调,“缩放定律”的优势正在逐渐消逝。他指出,谷歌的Gemini、xAI的Grok-3以及Deepseek的最新模型,均已逼近GPT-4的技术水平。就连OpenAI的创始人奥尔特曼也承认,公司未来的领先优势将更加微弱。微软CEO纳德拉同样表达了类似的观点,认为OpenAI在模型能力方面的独特领先地位即将成为过去。
据媒体报道,微软内部已决定暂停原计划投入160亿美元升级预训练基础设施的方案,转而专注于为OpenAI提供推理算力以寻求收益。纳德拉曾表示,数据中心可能过剩,租赁优于自建,甚至考虑使用开源模型支持CoPilot。这一系列举措预示着,单纯依赖规模扩张建立壁垒的“预训练时代”已经走到了尽头。
Baker还强调了数据在模型蒸馏过程中的重要性。模型蒸馏是一种将大模型的知识迁移至小模型的技术,但如果没有独特且有价值的数据作为支撑,前沿模型的投资回报率将大打折扣。他认为,独特的数据最终将成为预训练超大规模模型差异化和投资回报率的唯一基础。
在谈到AI计算的未来格局时,Baker预测,巨型数据中心将减少至2-3个,而推理算力将占据95%的市场份额。他解释说,成本效益推理将依赖于更便宜的电力和量化压缩技术,如Deepseek R1的1-bit LLM,以降低推理成本。
最后,Baker总结道,与之前预训练和推理阶段计算资源各占一半的情况不同,未来预训练将仅占5%,而推理阶段将占据主导地位。卓越的基础设施将成为决定胜负的关键因素。至于OpenAI是否能在五年后继续保持领先地位,他认为这将取决于其先发优势、规模优势以及产品影响力。