2024年的中国大模型领域,已不再是一场单纯的技术较量,而是演变成为一场巨头与新兴势力激烈交锋的混战。在这片战场上,阿里巴巴、腾讯、字节跳动等互联网巨头,以及华为、小米等硬件领域的强者,还有如梁文峰、王小川等创业者,都纷纷划定自己的势力范围,而他们的核心竞争武器正是“人才”。
在这场混战中,技术的快速迭代、资本的疯狂涌入以及战略的精心布局,最终都汇聚成了一场围绕顶尖人才的激烈争夺。这不仅关乎企业的生死存亡,更将深刻影响中国人工智能产业的未来格局。
阿里巴巴,作为中国最早涉足大模型的“先行者”,一度凭借其开源框架和达摩院的技术积累稳坐行业头把交椅。然而,2024年的阿里巴巴却遭遇了“人才流失”的困境。被誉为“AI框架教父”的贾扬清选择离职,创办了自己的AI基础设施公司,直接冲击了阿里巴巴的技术护城河。随后,多模态领域的领军人物杨红霞也带领团队转投字节跳动,使得达摩院的技术储备遭受重创。
面对困境,阿里巴巴并未坐以待毙,而是积极挖来了全球顶尖的人工智能科学家许主洪,负责AI To C业务的多模态基础模型及Agents相关研究与应用。许主洪正在筹备一个规模超百人的顶级AI大模型研究团队,试图通过深耕行业场景来弥补开源策略难以维系的技术壁垒。
字节跳动则凭借其强大的流量和资本优势,采取了激进的人才策略,试图撕开技术缺口。杨红霞的加盟,无疑提升了其在多模态领域的竞争力。字节跳动内部成立了多个专注于AI大模型研发的团队,并从阿里巴巴挖走了通义大模型的技术负责人周畅及其团队,同时还吸引了谷歌、面壁智能等公司的核心AI人才。
字节跳动的战术清晰明确:通过重金引进人才,打破技术代差,将学术大牛与产业老将相结合,形成技术突击队,再通过抖音、剪映等超级入口完成场景闭环。这种“人才-产品”的双螺旋战略,正在改变大模型竞争的游戏规则。
腾讯则采取了更为稳健的布局策略。AI Lab创始人张正友升任混元大模型总负责人,为腾讯注入了严谨的学术基因。腾讯还通过投资和合作,进一步扩大了其AI人才储备。2024年,腾讯投资了多家AI新锐公司,并启动了“青云计划”,计划扩招50%的大模型人才,为全球顶尖学子提供定制化培养方案和极具竞争力的薪酬待遇。
腾讯的打法独特,通过“产学研三位一体”的模式,与高校共建实验室,将青年学者的理论创新快速转化为工程实践。这种策略在降低人才争夺成本的同时,也悄然构建了技术纵深的护城河。
华为则选择了另辟蹊径。在数据通信领域率先落地网络智能化技术,推出Net5.5G战略,并交由通信副总裁赵志鹏推动普及。华为云首席科学家田奇主导研发的盘古大模型3.0,在自动驾驶等领域取得了显著成果。华为的生存智慧在于避开正面战场,用行业Know-how构建技术护城河,将5G云计算等既有优势转化为场景落地的加速器。
百度作为中文大模型的早期布道者,正面临后来者的全面冲击。王海峰统领的文心大模型团队虽未出现核心流失,但商业化压力迫使其转向医疗、金融等垂直领域。原搜狗CEO王小川虽与百度有过接触,但最终选择自立门户,聚焦医疗赛道。这反映出了百度在保持开放生态与守住核心阵地间的平衡难题。
小米则在端侧模型这片新兴战场上采取了“巧劲”。内部成立了专门的AI平台部,元老级技术大牛张铎担任总负责人。对外,小米以千万级年薪挖来了DeepSeek V2的核心开发者之一、95后天才少女罗福莉。雷军亲自带队搭建GPU万卡集群,支持AI大模型的训练和优化。小米试图通过端侧计算降低对云端算力的依赖,在手机、智能家居等场景中开辟新战线。
在这场割据战中,人才的流动轨迹清晰地勾勒出各家企业的战略重心。技术领袖的每一次转身,都预示着派系对未来的押注。杨红霞从阿里巴巴转投字节跳动,标志着多模态技术成为核心战场;许主洪从Salesforce转投阿里巴巴,可能推动其在多模态大模型的研发和商业化应用上取得突破;而小米则通过张铎、罗福莉等人的加入,押注端侧模型,试图绕过算力军备竞赛。
人才的流动本质上是技术路线与资源分配矛盾的集中爆发。当技术进入应用深水区,人才流动越来越取决于场景数据与技术路线的匹配度。资源争夺的隐性规则也在重塑江湖秩序,企业从“拼参数”转向“拼场景”,技术理想主义正让位于商业现实的精密计算。
在这场没有终局的战争中,巨头们试图通过“技术混血”打破同质化僵局,跨界合作成为生存法则。同时,初创公司凭借灵活机制和底层创新,开始从巨头手中争夺话语权。如梁文峰的Deepseek、陈云霁和陈天石兄弟的智谱AI以及王小川的百川智能等,这些“小而精”的技术帮派,用差异化、垂直化战略撕开巨头防线,推动大模型江湖向多元共生的新纪元演进。