中国杭州的AI公司Deepseek近日在全球科技界引发了轰动。其最新发布的DeepSeek-v3模型不仅在开源模型中独占鳌头,更与世界顶级的闭源模型GPT-4o和Claude-3.5-Sonnet在性能上并驾齐驱。
Deepseek,这家量化巨头幻方量化的子公司,于12月26日正式推出了这一革命性的模型。令人瞩目的是,DeepSeek-v3的训练成本仅为600万美元,相较于同类模型,成本降低了整整10倍,展现了极高的资源运用效率。这一成就让众多AI投资机构负责人赞叹不已,甚至有人称DeepSeek发布的技术论文堪称“黄金”。
Deepseek的崛起并非一蹴而就。今年5月,其发布的DeepSeek V2模型就因性价比出众而在AI界崭露头角。然而,仅仅过了半年多时间,Deepseek便再次实现了自我超越,推出了性能更为强劲的DeepSeek-v3。
据悉,DeepSeek-v3在多项评测中均表现出色,特别是在百科知识、长文本、代码、数学以及中文能力方面,更是超越了其他同类模型。尤为在数学领域,DeepSeek-v3在美国数学竞赛和全国高中数学联赛中的表现,远超所有开源和闭源模型。
DeepSeek-v3的生成速度也实现了显著提升,从V2.5模型的20 TPS跃升至60 TPS,提升幅度达到3倍。在API服务价格方面,Deepseek也给出了极具竞争力的报价,并设置了长达45天的优惠体验期,进一步吸引了用户的关注。
Lepton AI创始人贾扬清则分享了与deepseek团队的往事。他透露,早在2019年,他就曾试图向deepseek推销AI云解决方案,但发现deepseek团队早已在实践中运用了他所提倡的高效资源利用理念。贾扬清认为,deepseek的伟大成就源于其多年的专业知识和实践经验。
作为量化巨头幻方量化的子公司,Deepseek一直保持着低调而神秘的姿态。幻方拥有1万枚英伟达A100芯片,为Deepseek提供了强大的硬件支持。去年4月,幻方宣布成立新组织,集中资源和力量探索AGI的本质,并在短短一年多时间里取得了显著进展。
Deepseek的创始人梁文锋是一个极致的技术理想主义者。他表示,Deepseek降价的原因一方面在于成本降低,另一方面也源于他们希望AI技术能够普惠大众,成为人人都能用得起的东西。梁文锋强调,他们并非为了趁机赚一笔,而是希望走到技术的前沿,推动整个生态的发展。
Deepseek的崛起无疑为中国AI界注入了新的活力。未来,随着技术的不断进步和创新,我们有理由相信,Deepseek将继续在AI领域大放异彩,为全球科技界带来更多的惊喜和突破。