ITBear旗下自媒体矩阵:

DeepSeek热浪下,云计算“卖水人”如何价值升级?

   时间:2025-02-09 20:13:12 来源:金融界作者:金融界编辑:快讯团队 发表评论无障碍通道

随着DeepSeek的热度在春节期间持续不减,A股市场中的投资者对DeepSeek概念股的追捧已不再局限于股权投资和应用端,而是进一步扩展到了云计算这一“幕后英雄”领域。

春节后,A股市场迎来了新年的首个交易周,期间,作为第三方云计算服务供应商的优刻得和青云科技,股价连续三天涨停。与此同时,在北交所上市的并行科技和首都在线也分别收获了显著的涨幅。并行科技连续两天实现了30%的涨停,而首都在线则连续两天上涨20%。

港股市场上,金山云的股价走势同样引人注目。自2024年10月的低点以来,金山云的股价已经上涨了五倍之多,并且在最近的十个交易日内,涨幅超过了70%。

云计算产业究竟是如何从DeepSeek的热潮中受益的呢?DeepSeek不仅证明了通过算法优化可以低成本地复现尖端大模型,而且李飞飞团队更是以极低的云计算费用,通过知识蒸馏和小样本微调的方法,仅用26分钟就成功训练出了具有推理能力的s1模型。这一成就进一步凸显了模型开源、算法创新、高质量数据以及算力租用对于中小企业高效构建优质模型的重要性。

对于这两个“高性价比”模型的训练和普及,云服务的作用至关重要。s1模型的训练是基于阿里云的通义千问(Qwen)模型进行的微调,仅使用了1000个样本数据和16块H100 GPU。而DeepSeek的开源模型则允许中小企业在云端进行微调,从而降低了构建模型所需的算力门槛。云计算商不仅为中小企业提供了训练和部署AI模型的基础设施,还通过弹性扩容等服务满足了日益增长的推理需求。

DeepSeek的核心创新在于其算法效率的显著提升和成本的大幅下降,这为中小企业切入AI领域提供了新的思路:它们可以按需租用算力,在云端训练自己的模型,而无需像大型科技公司那样投入巨额资金构建大规模的GPU集群。云计算厂商在这一过程中扮演了“幕后推手”的角色,将DeepSeek等大模型的API能力开放给更多的C端用户,或作为底座模型开发出更多的垂直类应用。

多个云平台已经宣布部署了DeepSeek旗下的模型。阿里云、百度智能云、华为云、腾讯云、京东云、火山引擎以及天翼云都已经接入了DeepSeek模型。海外的云巨头如亚马逊AWS和微软Azure也宣布了对DeepSeek的支持。国家超算互联网平台也已经正式上线了DeepSeek-R1模型的多个版本,并将陆续更新更大的模型版本。

在开源模型的生态系统中,中小企业更倾向于依靠云服务来完成AI化转型,而不是自建算力。第三方中立云企业凭借其中立性和强大的云计算服务能力,为各类企业提供支持,满足AI训练和推理的需求,有望在这一领域脱颖而出。

针对云平台与大模型如DeepSeek的合作部署,资深人工智能专家表示,云平台会提供必要的计算、存储和网络资源,以支持大模型的运行和数据处理。在合作过程中,双方还会共同优化模型性能,提升用户体验。云平台还负责大模型的运维管理,确保其稳定运行并及时更新迭代。通过这种合作模式,云平台能够提供高效、便捷的大模型服务,同时也促进了自身业务的发展。

随着DeepSeek API定价仅为GPT-4的1%,吸引了大量用户调用。尽管DeepSeek实现了低成本高性能,但在春节期间由于访问量剧增,经常出现宕机情况,推理算力不足的问题已经显现。未来,随着模型训练成本的进一步下降,应用普及度有望大幅提升,这将进一步推动推理算力的需求增长。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version