近期,AI领域的新星DeepSeek-v3崭露头角,将其背后的公司推上了风口浪尖。这家一向保持低调的企业,因其在人工智能领域的卓越成就而备受瞩目。
在DeepSeek的团队中,不乏来自顶尖学府的精英。清华大学与北京大学的在读生与应届生,在这里占据着举足轻重的地位。邵智宏,这位清华交互式人工智能课题组的博士生,便是其中的佼佼者。他在黄民烈教授的指导下,不仅参与了DeepSeek-Prover、DeepSeek-Coder-v2等多个关键项目,还曾在微软研究院积累了宝贵的经验。
同样引人注目的还有北大计算机学院的朱琪豪。这位2024届的博士,在校期间便发表了16篇CCF-A类论文,并两次荣获ACM SIGSOFT杰出论文奖。他更是DeepSeek-Coder-V1的主导开发者,展现了非凡的才华与实力。
代达劢,另一位北大计算机学院的博士毕业生,也是DeepSeek团队中的一颗璀璨明星。他师从穗志方教授,发表了20余篇顶会论文,并荣获EMNLP 2023最佳长论文奖。他的加入,为DeepSeek的科研实力注入了新的活力。
DeepSeek-V2的突破性创新MLA架构,同样离不开高校人才的贡献。高华佐,这位北大物理系的毕业生,以及北邮研究生曾旺丁,他们在各自领域都有着深厚的学术积累。而赵成钢,作为超算团队的成员,曾三次获得世界大学生超算竞赛冠军,如今在DeepSeek担任训练/推理基础架构工程师,为公司的技术发展提供了有力支持。
DeepSeek的创新并非仅限于正式员工。实习生们同样在这里留下了自己的印记。辛华剑,这位中山大学逻辑学专业的学生,在实习期间参与了数学定理证明模型DeepSeek-Prover的开发,并成功获得了爱丁堡大学博士项目的录取。而清华博士生孙景翔,则在实习期间与导师刘烨斌合作,在3D生成领域取得了突破性进展。
那么,DeepSeek究竟是一个怎样的团队?其组织架构又有何独特之处?这或许要从创始人梁文锋的用人之道说起。早在2023年5月,当DeepSeek刚刚宣布进军大模型领域时,梁文锋便透露了公司的招人标准:看重能力而非经验,核心技术岗位以应届和毕业一两年的年轻人为主。这样的理念,无疑为DeepSeek打造了一支充满活力与创造力的团队。