在人工智能领域,一场突如其来的风暴正席卷全球,而这场风暴的中心,是一个名为DeepSeek的模型。它不仅在短时间内抢占了各大头条,还让业界内外为之震惊,就连之前备受瞩目的国产大模型如Kimi、豆包,以及用户基数庞大的文心一言和通义千问,在其光芒之下也显得黯然失色。
DeepSeek的崛起,并非偶然。它的出现,如同一颗璀璨的新星,照亮了AI前行的道路,甚至引发了关于其是否已经超越了OpenAI的热烈讨论。OpenAI的CEO山姆·奥尔特曼也不得不重新审视公司的开源策略,坦言或许站在了历史的错误一边。
数据最能说明问题。DeepSeek上线仅20天,日活跃用户就突破了2000万大关,成为全球增速最快的AI应用。与之相比,ChatGPT达到这一数字用了244天,而DeepSeek仅用了其零头的时间。20天后,DeepSeek的日活更是达到了2215万,这一数字已经是ChatGPT日活用户的41.6%,远超豆包的1695万。
这场AI风暴,与以往任何一次都不同。它是由一家中国的创业公司主导引发的,而非科技巨头。这不禁让人好奇,为何是DeepSeek脱颖而出?
事实上,DeepSeek的成功并非一蹴而就。其背后的团队在AI领域深耕多年,甚至早于国内大厂布局。DeepSeek由知名私募巨头幻方量化孕育而生,创始人梁文锋自大学时期就笃信人工智能将改变世界,这一信念也成为了他创业以来的终极愿景。
幻方量化自2015年成立以来,就致力于使用人工智能进行量化交易。2016年,第一份由深度学习生成的交易仓位上线执行,2017年全面应用深度学习技术进行交易。到了2018年,幻方更是将AI确定为公司的主要发展方向,并成立了幻方AI。自2019年至2021年间,幻方相继自主研发了“萤火一号”与“萤火二号”AI集群,极大提升了算力支持。
当ChatGPT横空出世时,市场惊讶地发现,国内拥有高性能GPU芯片最多的并非某家人工智能公司,而是梁文锋旗下的幻方量化。这足以证明幻方对AI的投入之大,丝毫不亚于大厂。
除了深厚的积累,DeepSeek的成功还得益于其创业团队的锐气。与互联网大厂的AI战略依附于现有业务体系不同,DeepSeek背靠幻方,既有强大的财力支持,又有创业者敢于“从零开始”,不怕试错的勇气。这使得DeepSeek能够沿着创新的道路,一路前行。
梁文锋对于创新的态度非常坚决。他认为,中国公司不能总是习惯于别人做技术创新,自己拿过来做应用变现。在这一波浪潮里,DeepSeek的出发点是走到技术的前沿,去推动整个生态发展。为了实现创新,DeepSeek抛弃了大厂常用的套路,而是采取了一种反常规的方式。
在团队组成上,DeepSeek没有像大厂那样去海外挖人,而是多由本土一些Top高校的应届毕业生组成。选人的标准一直都是热爱和好奇心。在工作机制上,DeepSeek也摒弃了大厂的层级和跨部门限制,鼓励员工自由讨论、自由组合、自由调用资源。
这种反效率的“失控”,恰恰为颠覆性创新的诞生提供了土壤。而DeepSeek,正是在这片土壤中茁壮成长起来的。
当被问及为何大厂没有做出DeepSeek时,后者表示,这本质上是组织惯性、商业化压力与技术路径共同作用的结果。这场由开源模型引发的技术革命,正在倒逼大厂重新思考创新逻辑。若无法跳出既有框架,其技术话语权或将进一步削弱。
DeepSeek的成功,无疑给业界带来了巨大的震撼和启示。它让人们看到,只要敢于创新、勇于探索,中国AI也有能力走在世界前列。