【ITBEAR】9月12日消息,在AI生成视频工具赛道日益拥挤的今天,生数科技凭借其新品Vidu脱颖而出,该产品专注于解决视频生成中的一致性问题,引发了行业内的广泛关注。
Vidu通过其新上线的主体参照功能,实现了在视频生成过程中锁定参考图片主体形象的能力,用户只需通过描述词即可切换场景,同时保持主体形象的一致性,这一创新功能显著提升了视频生成的连贯性和可控性。
据ITBEAR了解,生数科技CEO唐家渝在近日的媒体开放日上宣布了这一功能,并表示这是解决当前视频模型存在的不可控局限性的关键步骤。他提到,尽管目前市场上已有不少AI生成视频产品,但在连续性、输出结果稳定性等方面仍有待提升。
唐家渝进一步解释,Vidu背后的技术架构融合了Diffusion与Transformer,这是全球最早由生数科技团队提出的视觉生成模型融合架构。他强调,尽管技术路线已逐渐收敛,但不同产品间的实际能力仍因算法细节和工程化实现而异。
在谈及视频生成时长时,唐家渝透露,目前Vidu模型已支持最长32秒的视频生成,但尚未正式上线。他表示,拓展生成时长需要模型具备更强的世界抽象理解能力,而这正是生数科技未来技术突破的重点之一。
商业化方面,生数科技采取了SaaS订阅和API两种模式并行的策略。唐家渝透露,目前公司已收到数万个API接入申请,且B端市场收入占比较大,但C端增长势头同样强劲。他预计,随着技术的不断成熟和应用场景的拓展,AI生成视频将逐渐走向大众化。
展望未来,唐家渝对生数科技在AI生成视频领域的发展充满信心。他表示,公司将持续致力于降低创作者门槛,加速创作过程,并探索更多模态的生成与理解统一模型。随着技术的不断进步,他相信AI生成视频将在不久的将来迎来更加广泛的应用。
#生数科技# #Vidu# #AI生成视频# #一致性生成# #多模态统一模型#