ITBear旗下自媒体矩阵:

AI生成视频技术大突破!年底或将颠覆你的观影体验?

   时间:2024-09-12 17:17:55 来源:ITBEAR作者:朱天宇编辑:瑞雪 发表评论无障碍通道

【ITBEAR】9月12日消息,在AI生成视频工具赛道日益拥挤的今天,生数科技凭借其新品Vidu脱颖而出,该产品专注于解决视频生成中的一致性问题,引发了行业内的广泛关注。

Vidu通过其新上线的主体参照功能,实现了在视频生成过程中锁定参考图片主体形象的能力,用户只需通过描述词即可切换场景,同时保持主体形象的一致性,这一创新功能显著提升了视频生成的连贯性和可控性。

据ITBEAR了解,生数科技CEO唐家渝在近日的媒体开放日上宣布了这一功能,并表示这是解决当前视频模型存在的不可控局限性的关键步骤。他提到,尽管目前市场上已有不少AI生成视频产品,但在连续性、输出结果稳定性等方面仍有待提升。

唐家渝进一步解释,Vidu背后的技术架构融合了Diffusion与Transformer,这是全球最早由生数科技团队提出的视觉生成模型融合架构。他强调,尽管技术路线已逐渐收敛,但不同产品间的实际能力仍因算法细节和工程化实现而异。

在谈及视频生成时长时,唐家渝透露,目前Vidu模型已支持最长32秒的视频生成,但尚未正式上线。他表示,拓展生成时长需要模型具备更强的世界抽象理解能力,而这正是生数科技未来技术突破的重点之一。

商业化方面,生数科技采取了SaaS订阅和API两种模式并行的策略。唐家渝透露,目前公司已收到数万个API接入申请,且B端市场收入占比较大,但C端增长势头同样强劲。他预计,随着技术的不断成熟和应用场景的拓展,AI生成视频将逐渐走向大众化。

展望未来,唐家渝对生数科技在AI生成视频领域的发展充满信心。他表示,公司将持续致力于降低创作者门槛,加速创作过程,并探索更多模态的生成与理解统一模型。随着技术的不断进步,他相信AI生成视频将在不久的将来迎来更加广泛的应用。

#生数科技# #Vidu# #AI生成视频# #一致性生成# #多模态统一模型#

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version