在人工智能技术的浩瀚宇宙中,深度学习框架犹如一座桥梁,连接着多样化的算力资源与层出不穷的算法模型,是推动大模型产业发展的核心要素。全球舞台上,TensorFlow与PyTorch早已占据领先地位,而在中国市场,这一格局正迎来新的挑战者。
近年来,华为推出的昇思MindSpore与百度打造的飞桨PaddlePaddle等本土深度学习框架,正以惊人的速度迎头赶上。在最近的昇思人工智能框架峰会上,这一趋势得到了生动展现:18家单位宣布了基于昇思的原生开发大模型成果,预示着国产AI框架的崛起。
会上,华为ICT战略与业务发展部总裁彭红华强调,人工智能框架不仅是AI时代的操作系统,更是软件生态的基石。一个领先的AI框架,必须具备高效、敏捷、开放的特性。华为将持续加大对昇思MindSpore的投入,通过开源的方式,推动中国人工智能框架生态的健康发展。
随着硬件资源的日益丰富,如何高效利用这些资源成为行业关注的焦点。智谱AI CEO张鹏在会上指出,当前的关键在于提升大模型的训练性能,这需要深度学习框架不断优化,实现软件与硬件、上层算法的完美适配。张鹏还透露,智谱自2020年起便与包括昇腾系列硬件在内的多家国产生态伙伴展开合作,共同推进国产大模型训练的创新。
昇思MindSpore开源社区理事长丁诚则从大模型技术的演进角度出发,提出了两个重点关注的方向。一是大模型的参数量、序列长度和模态结构正以指数级速度增长,这对深度学习框架提出了更高的计算要求。二是OpenAI的o1模型推动了计算过程从单任务、单模型向多任务、多模型的转变,深度学习框架需要解决多模型协同交互下的复杂编程问题。
开源策略是昇思快速追赶的关键。通过从社区论坛收集技术问题,进行技术预研和规划,昇思得以迅速响应大模型爆发带来的新需求。自2020年开源以来,昇思已孵化、支持了50多个国内外主流大模型,开源版本累计下载量突破1100万次,覆盖全球130多个国家和地区。
昇思的成功不仅体现在市场份额上。目前,已有超过3.7万名开发者参与昇思社区贡献,与360多所高校科研院所展开教学及科研合作,联合1700多位生态伙伴打造了超过2000个解决方案。PaperwithCode网站显示,基于昇思发表的原创论文数量累计超过1700篇,位列全球第二、中国第一。
昇思还在不断优化开发者编程体验,提供丰富的分布式并行策略,降低迁移学习成本。面对类o1模型带来的技术挑战,昇思正在完善多模型多任务调度、训推无缝转换能力,加速类o1模型的演进升级。在AI for Science场景方面,昇思也在持续升级底层函数式编程体验,并打造高性能AI for Science使能套件,推动科研创新。
在昇思人工智能框架峰会上,昇思的快速发展得到了业界的广泛认可。未来,随着技术的不断进步和生态的持续完善,昇思有望在中国乃至全球AI框架市场中占据更加重要的地位。