在2025年世界人工智能大会的热烈氛围中,视频生成领域的创新先锋生数科技吸引了众多目光。该公司CEO骆怡航博士,在媒体专访中深度剖析了生数科技在视频生成技术上的最新突破及其对未来趋势的独到见解。
骆怡航博士首先聚焦于生数科技今年7月推出的Vidu Q1参考生功能,他强调,参考生视频技术相较于文生视频和图生视频,更能代表AI视频创作的核心潜力。参考生视频避免了文生视频内容的不连贯问题,同时也克服了图生视频对模型创造力的束缚,让视频创作更加自由流畅。
生数科技自去年启动参考生视频技术的研发以来,已历经四次迭代,不断在提升视频内容的一致性方面深耕细作。骆怡航指出,一致性对于广告、影视等商业创作领域至关重要,是生数科技持续优化的关键方向。
骆怡航还分享了生数科技与清华大学携手发布的具身智能模型Vidar。作为国内首个基于视频生成模型的具身基座模型,Vidar的生成为数字世界与物理世界的融合开辟了新路径。尽管具身智能的大规模应用尚需时日,但生数科技已规划在未来产业成熟时加大投入。
在谈及商业化策略和技术升级方向时,骆怡航透露,生数科技正致力于推动AI视频内容生成技术向更高阶段迈进。他提出了人与AI协作的三阶段理论:第一阶段以图生视频为主,虽效率有所提升但仍需复杂流程;第二阶段则以参考生视频为核心,通过直接选择主体即可生成视频,显著提升了创作效率;第三阶段则展望了AI完全主导内容生产的未来,届时创作者可更专注于创意和关键设计。
骆怡航进一步指出,生数科技当前的首要任务是满足视频行业最严苛的专业需求,而非急于扩展C端市场。他解释说,当前技术尚不足以支持普通用户轻松制作高质量视频,只有在一致性和速度方面取得突破后,才能实现AI视频创作的普及。
骆怡航还分享了生数科技在服务B端专业用户过程中的技术积累,如根据广告电商客户的需求提升内容一致性,或在动画场景中优化风格和生产效率。这些在专业领域的精进,最终将惠及广大C端用户。
生数科技的视频生成模型Vidu在上线一周年之际,已生成超过3亿个视频,吸引了3000多万用户,B端市场占有率位居行业前列。这些数据不仅彰显了Vidu的强大影响力,也推动了生数科技的年化收入突破2000万美元大关。