ITBear旗下自媒体矩阵:

月之暗面引入华为AI猛将,杨植麟揭秘数学模型成“登月”新篇章

   时间:2024-11-29 17:30:49 来源:ITBEAR作者:南方都市报编辑:瑞雪 发表评论无障碍通道

近期,大模型领域的初创企业月之暗面被曝引入了一位重量级技术专家——刘征瀛,他曾是华为诺亚方舟实验室AI基础理论团队的核心研究员,并一度受到字节跳动高层的青睐,邀请其加入其大模型团队。针对这一消息,月之暗面方面向媒体表示,目前官方不便作出回应。

刘征瀛的学术背景十分耀眼,他本科阶段在北京大学元培学院攻读物理和数学双学位,后赴巴黎萨克雷大学深造,获得博士学位,专攻自动化深度学习(AutoML)领域。他的研究方向聚焦于AI for Math以及大语言模型推理能力的深入探索与应用。

在2023年年底的一次演讲中,刘征瀛以《AI4Math: 挑战与进展》为题,分享了他对当前大语言模型(LLMs)发展的见解。他指出,尽管LLMs在文本分类、机器翻译等传统自然语言处理任务上已展现出类人甚至超人的水平,但在符号推理、数学推理等复杂任务上,仍有巨大的提升空间。

本月,月之暗面在经历了一场仲裁风波后,于11月16日正式发布了其首款推理能力强化模型k0-math。据透露,k0-math在多项基准能力测试中,数学能力已能与全球领先的OpenAI o1系列中的o1-mini和o1-preview两个公开模型相媲美。月之暗面创始人杨植麟表示,k0-math的研发思路与o1系列相似,均采用了强化学习和思维链技术。

在谈及月之暗面的未来规划时,杨植麟强调了数学模型和深度推理的重要性,将其视为公司“登月计划”的第二步。同时,他也透露了公司在业务上的聚焦策略,即主动进行业务减法,专注于核心领域的发展。杨植麟表示,月之暗面在所有大模型创业公司中人数最少,但算力和人的比例却是最高的,他认为这是公司保持竞争力的关键。

对于与字节跳动豆包等大模型产品的竞争,杨植麟持开放态度。他表示,月之暗面更关注如何为用户提供真正的价值,而非竞争本身。他强调,公司的核心在于传递更好的技术和产品,为用户创造更大的价值。未来,月之暗面将继续聚焦提升模型的思考推理能力,坚持做正确的事情,而不是刻意追求与众不同。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version