ITBear旗下自媒体矩阵:

李开复:中美公司争相奔向o1,零一万物也在其中?

   时间:2024-10-16 16:07:27 来源:ITBEAR作者:冯璃月编辑:瑞雪 发表评论无障碍通道

【ITBEAR】在近期大模型行业遭遇信任危机的背景下,国内多家大模型创业公司遭遇了不同程度的质疑,其中零一万物更是被传言放弃了预训练。对此,零一万物创始人兼CEO李开复在微信朋友圈进行辟谣,强调公司一直在进行预训练,并计划通过推出新的预训练模型来证明这一点。

10月16日,零一万物正式发布了其最新的旗舰模型Yi-Lightning,旨在挑战大模型的更高性能。在LMSYS盲测竞技场总榜上,Yi-Lightning取得了显著成绩,位列第六,仅次于OpenAI的GPT-4o、o1系列以及Google的Gemini 1.5 pro系列,与马斯克xAI旗下的Grok-2持平,这是中国大模型厂商在该榜单上取得的最好成绩。

零一万物特别强调了Yi-Lightning在推理速度上的提升。据其内部评测数据,在8xH100算力基础下,Yi-Lightning的首包时间相比Yi-Large减少了一半,最高生成速度提升了近四成。这一提升得益于团队在AI Infra层的投入以及模型架构从Dense Model改为MoE架构。

为了平衡MoE架构中的激活参数规模与推理速度及成本,零一万物在Yi-Lightning的架构中引入了混合注意力机制、动态ToP路由以及多阶段训练等三种技术思路。这些技术旨在优化模型在处理长序列数据时的性能和计算资源消耗,灵活调整激活的专家网络数量,以及有针对性地进行强化训练。

Yi-Lightning的定价为0.99元/百万tokens,李开复表示这是一个具有理想利润空间的定价。同时,零一万物还发布了针对零售和电商等场景的行业应用产品AI 2.0数字人,并已接入Yi-Lightning。这一数字人产品在没有大模型专家或系统集成商帮助的情况下,具备一定IT能力的客户可以相对高效地完成部署。

零一万物已形成了鲜明的海内外商业布局。其ToC业务选择在国外市场,因为用户成本更低、变现能力更高。而ToB业务则以国内市场为主,李开复表示,这类业务在海外对供应商本土化要求高,并不适合现阶段的零一万物。在国内ToB业务产品矩阵上,除了已经发布的AI 2.0数字人、API之外,零一万物还计划近期发布AI Infra解决方案、私有化定制模型等其他业务。

对于“大模型行业将逐步放弃预训练”的业界推测,李开复表示,做预训练通用大模型是一个系统性技术活,需要众多懂芯片、模型、推理、架构、算法的人才,且成本非常高。他认为,以后可能会有越来越少的大模型公司做预训练,但“六小虎”均有足够的融资额度来支付预训练模型的投产运行成本。

面对通用大模型的下一技术进程,李开复预计五个月后就会有不少类似OpenAI o1模型的能力出现在各个公司,包括零一万物。他透露,OpenAI目前仍对一些先进技术有所保留,不急于公布。对于缩短中美大模型差距的技术时间差,李开复认为国内公司凭借数据处理、训推优化等方法论已经有相对成熟的打法,能保持六个月左右的追赶周期已经是很好的结果。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version