在AI领域,一家名为DeepSeek的中国初创公司正迅速崭露头角。据凤凰网科技报道,这家仅成立一年多的企业,其AI模型已取得了令人瞩目的突破性进展,性能可与世界顶级聊天机器人相媲美,但成本却大幅低于后者,这一成就让美国硅谷感到震惊。
DeepSeek的异军突起打破了业界的传统认知。过去,人们普遍认为AI的未来发展需要巨大的算力和能源投入作为支撑。然而,DeepSeek的创新成果却似乎颠覆了这一观念。随着其引发的热潮不断升温,投资者开始重新评估它对美国竞争对手及其硬件供应商的影响,这也导致全球科技股在本月底出现了大幅下跌。
DeepSeek由量化基金幻方量化的负责人梁文峰于2023年创立。该公司开发的AI模型采取了开源策略,这意味着整个开发人员社区都可以参与检查和改进软件。去年1月初,DeepSeek的移动应用一经发布,便迅速在美国iPhone下载排行榜上登顶。
DeepSeek的AI模型与其他聊天机器人的显著区别在于,它会在对提示做出响应之前阐明其推理过程。该公司声称,其R1版本提供的性能与OpenAI的最新版本相当,并已向有兴趣使用该技术开发聊天机器人的个人授予许可。这一举措进一步扩大了DeepSeek的影响力。
虽然DeepSeek并未全面披露其R1新模型的细节,但该模型的训练和开发成本似乎仅为OpenAI或meta等巨头最强产品的一小部分。R1的高效率不禁让人对业界是否需要继续投入巨资购买英伟达等公司的最新、最强大的AI加速器产生质疑。同时,这也让外界更加关注美国针对中国的先进AI芯片出口管制政策。
DeepSeek的R1模型在多个主要基准测试中表现出色,接近或超越了竞争对手的模型。例如,在测试数学能力的AIME 2024、测试常识的MMLU和测试问答性能的Alpacaeval 2.0等测试中,R1均取得了优异成绩。它还在加州大学伯克利分校研究生开发的AI系统排名网站Chatbot Arena上名列前茅。
自发布最早模型以来,DeepSeek一直备受关注。去年11月,它向世界预览了旨在模仿人类思维的DeepSeek R1推理模型,该模型为其移动聊天机器人应用提供了技术支持。再加上网页版,这款聊天机器人迅速成为全球知名的廉价OpenAI替代品。硅谷知名投资人马克·安德森甚至将其称为“AI的斯普特尼克时刻”,这一称谓源自冷战时期的历史术语,现已成为一种隐喻,用来描述某个事件或时刻引发的强烈危机感或紧迫感。
根据市场追踪公司App Figures的数据,截至今年1月25日,DeepSeek移动应用已被下载超过160万次,并在澳大利亚、加拿大、中国、新加坡、美国和英国的iPhone应用商店中排名第一。这一成绩充分展示了DeepSeek在全球范围内的受欢迎程度。
DeepSeek的创始人梁文峰出生于1985年,广东人,拥有浙江大学电子与信息工程学士和硕士学位。他以1000万元人民币的注册资本创立了DeepSeek。在接受媒体采访时,梁文峰表示,进一步进步的瓶颈不是更多的融资,而是美国对获得最佳芯片的限制。他强调,中国需要发展自己的国内生态系统,类似于围绕英伟达及其人工智能芯片构建的生态系统。
在中国的AI行业中,DeepSeek凭借其开源策略脱颖而出。这一策略旨在快速吸引最多的用户,并在庞大用户基础上制定创收策略。由于DeepSeek的模型更实惠,它已经在协助降低中国AI开发商的成本。在过去一年半时间里,其他规模更大的公司在中国打起了价格战,出现了连续的降价浪潮。
DeepSeek的成功对全球AI市场产生了深远影响。它可能会促使OpenAI和其他美国AI供应商降低价格以保持领先地位。同时,这也引发了人们对meta、微软等公司巨额支出的质疑。这些公司已经承诺将投入巨额资本支出用于AI基础设施的建设。然而,如果效率更高的模型能够用更少的投入与现有模型竞争,那么传统的大规模资金投入模式将面临挑战。
DeepSeek的崛起还引发了全球股市动荡。投资者开始抛售英伟达、阿斯麦等受益于AI服务需求激增的公司股票。而与DeepSeek有关的中国公司股价则出现上涨。全球开发者已经开始尝试使用DeepSeek的软件并希望基于它开发工具,这可能加速先进AI推理模型的普及,但同时也可能引发更多关于如何设立使用护栏的担忧。
尽管DeepSeek取得了显著成就,但其云基础设施可能会因其模型的突然走红而受到考验。1月27日,该公司就经历了一次短暂的大宕机。随着新老用户向其聊天机器人提出更多问题,DeepSeek将不得不应对更大的流量挑战。