ITBear旗下自媒体矩阵:

阶跃星辰Step-2登顶“最难AI榜”,中国大模型实力崭露头角

   时间:2024-12-11 10:56:32 来源:甲小姐甲子光年作者:甲小姐甲子光年编辑:瑞雪 发表评论无障碍通道

在AI领域的一项重量级比拼中,一家名为阶跃星辰的创业公司悄然崭露头角,其在“最难AI榜”——LiveBench上取得了中国第一、全球第五的佳绩,这一消息迅速在业界引起了轰动。

据悉,LiveBench榜单以其严苛的标准和无法被操纵的评测机制著称,被视为AI圈的“试金石”。该榜单由图灵奖得主杨立昆等人联合推出,每月发布新问题,并根据最新数据集和文献设计问题,确保评测结果的客观性和公正性。在这样的背景下,阶跃星辰的Step-2大模型能够脱颖而出,实属不易。

Step-2在IF Average(指令跟随)这一关键指标上表现尤为突出,超越了包括o1在内的众多国内外顶尖语言大模型。这一成绩不仅展示了Step-2在语言生成上的细节控制能力,更体现了其卓越的人类指令理解能力。

阶跃星辰之所以能够取得如此佳绩,与其自研的Step-2大模型的两大特点密不可分:万亿参数和MoE架构。相较于之前的Step-1模型,Step-2在综合能力上提升了近50%,无论是编程、逻辑推理还是数学、知识等维度,都能更加出色地解决问题。Step-2在模糊指令理解和知识分布上也取得了显著突破,能够精准捕捉用户需求,提供准确、个性化的响应。

为了验证Step-2的实际效果,我们在阶跃星辰的C端智能助手「跃问」上进行了测试。面对一道复杂的数学题,「跃问」能够迅速给出条理明晰的正确答案,充分展示了Step-2的解题能力。而在文字创作方面,Step-2同样表现出色,能够生成高质量、有创意的文字内容,并根据用户指令进行精确的调整和优化。

阶跃星辰的CEO姜大昕表示,为了实现万亿参数模型,MoE架构几乎是一个必选项。然而,从千亿模型到万亿模型的跨越过程中,阶跃星辰团队遇到了前所未有的挑战。他们选择了迎难而上,完全自主研发并从头开始训练MoE架构。通过部分专家共享参数、异构化专家设计等创新设计,Step-2中的每个“专家模型”都得到了充分训练,从而实现了超强的能力。

阶跃星辰在模型矩阵和战略布局上也展现出了全面性和前瞻性。在众多国产模型厂商中,阶跃星辰是为数不多同时布局大语言模型与多模态模型的公司。其Step系列通用大模型矩阵已经覆盖了从千亿参数到万亿参数、从语言到多模态、从理解到生成的全面能力。阶跃星辰的模型迭代速度也走在了全国前列,不断推出新版本和新技术,为AI技术的发展注入了新的活力。

随着AI技术的不断发展,国内外基座大模型研发的竞赛仍在继续。阶跃星辰作为国产大模型的佼佼者,其在LiveBench上的优异表现无疑为国产AI技术的发展注入了新的信心和动力。我们期待阶跃星辰在未来的发展中能够继续创造更多惊喜,为AI技术的进步贡献更多力量。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version