在科技界的一次重大盛会中,字节跳动以其独特的创新方式吸引了广泛关注。此次大会的焦点不仅在于其虚拟主持人“豆包”的亮相,更在于豆包大模型家族的全面升级以及视觉理解模型价格的革命性调整。
火山引擎总裁谭待在会上宣布,自豆包大模型发布以来,其日均tokens使用量在短短7个月内激增超过33倍,总量突破4万亿。这一惊人的增长速度,标志着大模型应用的迅速渗透。在豆包的调用量上,信息处理场景增长了39倍,硬件助手场景增长了13倍,AI工具场景也增长了9倍。
尤为引人注目的是,字节跳动在此次大会上宣布豆包大模型家族全面升级,并正式将视觉理解模型的价格推入“厘时代”。谭待指出,豆包视觉模型的单价仅为0.003元,比行业平均价格低了85%。这一举措不仅降低了视觉理解模型的使用门槛,更推动了AI技术的普及。
豆包视觉理解模型已经接入豆包App和PC端产品,为用户提供更加便捷、快速的输入体验。豆包战略研究负责人周昊表示,豆包一直致力于提升用户输入的效率和便利性,因此非常注重多模态输入能力的打磨,包括语音、视觉等。这些模型已通过火山引擎开放给企业客户,助力企业实现智能化升级。
会上,豆包3D生成模型首次亮相,并与火山引擎数字孪生平台veOmniverse结合使用,形成了一套支持AIGC创作的物理世界仿真模拟器。这一创新技术的应用,将极大地提升AIGC的创作效率和质量。
豆包大模型的多款产品也迎来了重要更新。豆包通用模型pro已经全面对齐GPT-4o,但使用价格仅为后者的1/8。音乐模型从生成60秒的简单结构,升级到能够生成3分钟的完整作品。文生图模型2.1版本更是在业界首次实现了精准生成汉字和一句话P图的产品化能力,并已接入即梦AI和豆包App。
即梦Dreamina的负责人张楠认为,生成式AI技术能够将人们脑海中的奇思妙想快速视觉化,就像做梦一样。即梦希望成为“想象力世界”的相机,记录每个人的奇思妙想,并帮助有想法的人轻松表达、自由创作。
在大会现场,谭待还透露了豆包大模型在终端设备上的广泛应用。目前,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台。来自智能终端的豆包大模型调用量在半年时间内增长了100倍。
在公布豆包视觉理解模型超低定价的同时,火山引擎还升级了火山方舟、扣子和HiAgent三款平台产品,以帮助企业构建自身的AI能力中心,并高效开发AI应用。其中,火山方舟发布了大模型记忆方案,并推出了prefix cache和session cache API,以降低延迟和成本。火山方舟还带来了全域AI搜索服务,实现了场景化搜索推荐一体化和企业私域信息的整合。
火山引擎认为,云原生是过去十年最重要的计算范式,而大模型时代则推动着云计算的变革。基于AI云原生的理念,火山引擎推出了新一代计算、网络、存储和安全产品,以满足大模型时代的需求。
在资本市场上,豆包概念股也备受关注。多家A股公司在公告及互动平台回应了与豆包的合作情况。例如,中科蓝讯表示,公司与字节跳动旗下的火山引擎展开了深度合作,其讯龙三代BT895x芯片已完成与火山方舟MaaS平台的对接,可向用户提供适配豆包大模型的软、硬件解决方案。南凌科技则透露,公司是火山引擎全线产品的代理商,与火山引擎在多个领域开展了合作。