近期,英文技术社区对中国AI产业的迅猛发展表现出了极大的关注与惊讶。这股震撼波主要源自两大创新成果:宇树(Unitree)的轮足式机器狗B2-W和开源MoE模型DeepSeek-V3。
宇树,这个早年曾被视为波士顿动力追随者的企业,如今已实现了技术上的华丽转身。从B系列型号开始,宇树的机器狗在灵活性方面已能与波士顿动力相媲美。而B2-W的推出更是令人瞩目,它采用了难度更高的动轮方案,成功在户外环境中完成了跋山涉水的训练。这一成就让许多美国网友难以置信,甚至有人质疑视频的真实性。
波士顿动力作为行业先驱,也曾短暂尝试过动轮方案,但最终还是未能持续。现代汽车在2020年以折扣价从软银手中收购了波士顿动力,而软银则是在2017年从谷歌那里购得。谷歌之所以出售,主要是认为该项目过于烧钱。这一理由在美国这个对亏损容忍度极高的风险资本系统中显得尤为离奇。波士顿动力为何会被视为不良资产频繁转手?这个问题的答案或许与美国科技行业对制造业的普遍厌弃有关。
A16Z的合伙人马克·安德森在2011年提出的“软件吞噬世界”观点,深刻影响了美国科技行业的思维。他认为,边际成本极低的软件公司将接管一切,而制造业等其他行业则相形见绌。然而,这种路径依赖最终导致了美国制造能力的丧失。如今,美国的DIY市场和高校学生甚至需要不远万里委托中国公司采购电子配件,因为在美国本土,他们找不到完整的供应链。
与此同时,中国在AI领域的追赶成果开始密集呈现。在“从零到一”的原型机研发阶段,欧美国家仍占据优势;但在“从一到十”的落地阶段和“从十到百”的量产阶段,中国的供应链成本直接决定了胜负。宇树的机器狗和DeepSeek的开源模型都是这一趋势的生动体现。
DeepSeek-V3在2000个GPU上,仅用不到600万美金和2个月的时间,就实现了对齐GPT-4o和Claude 3.5 Sonnet的测试结果。这一成就让国际大模型厂商都为之震惊。DeepSeek的创始人梁文锋表示,公司并不缺钱,而是受到高端芯片禁运的困扰。他强调,中国的大模型公司需要在好、快、便宜和可靠性之间找出最优解。
梁文锋的几家公司从量化交易转型到大模型开发,并不是简单的金融转为科技的过程,而是数学技能在不同应用场景之间的切换。他认为,中国AI的发展需要逐步成为贡献者,而不是一直搭便车。他强调,中国AI与美国之间的差距是原创与模仿之差,只有改变这一点,中国才能成为真正的创新者。
梁文锋的乐观态度和对未来的坚定信念令人印象深刻。他认为,随着经济的发展和社会的进步,中国将涌现出越来越多的硬核创新者。他们将对世界未来的塑造产生重要影响。尽管目前可能还不容易被理解,但随着事实的教育和社会的演变,群体性想法终将改变。