【ITBEAR】近年来,随着AI技术的迅猛发展,AI视频已逐渐渗透到我们的日常生活中,从短视频平台的小猫视频合成,到西游记中的AI妖精形象,再到动画片中的合成画面,AI视频无处不在。据统计,中国AI视频生成的潜在市场空间预计超过5800亿元,这无疑是一个巨大的市场。
然而,随着市场的火热,一系列问题也逐渐浮现。成本高昂、质量参差不齐、协同困难和性能挑战等问题,让众多初创企业和大厂头疼不已。以GPT-4为例,其开发成本高达1亿美元,训练成本也接近8000万美元。而视频模型的训练和推理成本更是高得惊人,如新推出的视频模型Sora,其算力需求远超GPT-4。
面对这些挑战,一些企业已经开始寻求解决方案。抖音和火山引擎便是其中的佼佼者。火山引擎近期推出的PixelDance效果惊人,其背后的功臣是一个名为BMF的智能框架。这个框架通过预处理海量视频数据,并在短时间内生产高质量的视频素材用于模型训练,从而大大提高了效率和质量。
BMF框架相当于一个“年夜饭一键全流程套餐”,它提供了一系列的工具和服务,帮助企业轻松、快捷地准备好“年夜饭”。这个套餐重点针对性地解决了行业痛点,如视频训练数据质量问题、性能难题等。
除了BMF框架,火山引擎还推出了BMF-Lite版本,更适合普通用户使用。这个版本实现了更轻量、更高效、更通用的进化,统一了各个平台的接口形式,方便集成部署。同时,火山引擎还自研了视频转码芯片,将自研的视频编解码技术融入其中,大大提高了转码能力。
在视频编解码层,火山引擎推出了基于自研视频转码芯片构建的“BVE1.2编码器”。这个编码器融合了深度学习技术,推出了革命性的智能混合编解码解决方案,极大地提升了编解码的效率。在第六届深度学习图像压缩挑战赛(CLIC大赛)中,“BVE1.2编码器”荣获两个冠军,实力不容小觑。
火山引擎的这些技术突破无疑为AI视频行业的发展提供了新的思路。通过开源BMF框架和BMF-Lite版本,火山引擎正在推动整个行业的进步和发展。这种竞争与合作共存的态度,无疑是中国AI行业最乐意见到的场面。