近日,国内AI领域的初创企业DeepSeek遭遇服务中断,其官方网站及API接口于1月27日显示不可用状态。据DeepSeek方面透露,这一“宕机”事件是由于新模型发布后用户访问量急剧增加所致。而就在前一天,即1月26日,DeepSeek也曾短暂出现服务波动。
回顾2024年底,DeepSeek推出了新一代大语言模型DeepSeek-V3,并宣布开源,这一举措迅速在AI领域引发轰动。DeepSeek-V3在多项基准测试中表现出色,不仅超越了主流开源模型,还与世界顶尖的闭源模型相媲美。尤其其训练成本极低,因此被形象地称为“AI界的拼多多”。
DeepSeek的崛起,也让其背后的关键人物之一——罗福莉走进了公众视野。这位95后的AI“天才少女”,因在DeepSeek-V2研发中的杰出贡献而备受瞩目。据悉,罗福莉本科就读于北京师范大学计算机专业,后在北京大学攻读计算语言学硕士学位。毕业后,她先后进入阿里达摩院和幻方量化从事AI研究工作,最终加入DeepSeek,参与研发了MoE大模型DeepSeek-V2。
就在DeepSeek-V3发布前夕,小米创始人雷军向罗福莉抛出了橄榄枝,开出千万元年薪的优厚待遇,邀请她领导小米AI大模型团队。这无疑是对罗福莉在AI领域才华的极大认可。
随着DeepSeek的火爆,其应用也迅速攀升至苹果中国和美国应用商店免费APP下载排行榜的榜首,甚至超越了ChatGPT。DeepSeek-R1作为其最新发布的模型,也在国外大模型排名榜Chatbot Arena上取得了显著成绩,与OpenAI的ChatGPT-4o最新版并列全类别大模型第三。然而,令人惊讶的是,DeepSeek-R1的预训练费用仅为557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。
DeepSeek的快速发展也带动了其招聘市场的火热。据招聘网站信息显示,DeepSeek的北京子公司正在大量招聘人才,共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深UI设计师等。其中,薪资最高的岗位为核心系统研发工程师(校招),薪资范围在6万元至9万元之间;而大部分岗位的起薪也在2万元及以上。该公司还在招聘实习生,AGI大模型实习生的日薪高达500元至1000元,数据百晓生实习生的日薪则为500元至510元。
DeepSeek的崛起不仅展示了中国在AI领域的强大实力,也为行业注入了新的活力和希望。随着技术的不断进步和应用的不断拓展,DeepSeek有望在未来继续引领AI领域的发展潮流。