在漫长的等待之后,Sora,这一由OpenAI精心打造的视频生成模型,终于在万众瞩目中亮相。北京时间12月10日凌晨,OpenAI的第三场直播活动将Sora正式推向了公众视野,这款自今年2月预告以来便备受期待的产品,此前仅向少数艺术家、知名演员及导演提供了试用机会,而此次的公开发布,瞬间点燃了全球网友的热情,服务器一度因访问量过大而陷入瘫痪。
相较于之前的版本,Sora Turbo在功能上实现了显著飞跃。它不仅支持生成最高达1080p分辨率、时长可达20秒的视频,更是在视频编辑领域迈出了重要一步。用户现在可以通过指令实现视频的重新混合、剪辑、循环、混合以及应用预设风格等多种操作,这使得Sora更像是一个功能强大的视频编辑器,而非单纯的视频生成工具。
Sora的正式发布,也引发了国内AI视频生成领域的广泛关注。众多国内同行纷纷表示,虽然面临挑战,但经过近十个月的追赶,他们已具备了一定的竞争力。为了验证这一说法,有媒体对国内外的几款代表性AI视频生成工具进行了实测对比。
在生成视频时长方面,Sora凭借其20秒的最长生成时间占据领先地位,紧随其后的是Runway,其单次生成时间可达10秒。相比之下,国内产品普遍在5至6秒左右。然而,值得注意的是,虽然白日梦宣称最长可生成6分钟的视频,但这并非单次生成的结果,而是通过分步生成和编辑实现的。
在收费方面,Sora采取了较为严格的付费策略,仅对ChatGPT的Plus和Pro会员开放使用,且价格不菲。相比之下,国内产品普遍提供了免费体验的机会,虽然部分功能或使用次数可能受限。
在功能对比方面,媒体选取了基础功能和进阶功能两个维度进行测试。基础功能主要考察各工具对文字指令的理解度、人物面部清晰度及多人物准确度。测试中,Sora在识别多主体数量方面出现了一定问题,未能准确识别出提示词中的所有主体。而在对人物面部的特写及复杂指令的理解方面,各工具均表现出了一定的能力,但存在差异。
进阶功能测试则主要聚焦于Sora发布的新功能。其中,Remix(重混)功能因实现复杂而成为测试的重点。然而,在实际操作中,Sora并未能完全展现出样片中的丝滑效果,出现了胡萝卜或小狗起飞等异常情况。尽管如此,仍有业内人士认为,这可能是由于提示词、场景或风格等因素导致的偶然现象。
综合来看,尽管Sora的发布给国内AI视频生成领域带来了一定的冲击,但并未达到让国内从业者恐慌的程度。众多国内产品经过近十个月的追赶,已在功能上实现了显著提升,并在一定程度上具备了与Sora竞争的能力。国内产品在收费策略上更加灵活,提供了更多免费体验的机会,这也为它们赢得了一定的市场份额。
在对比过程中,业内人士也指出了Sora的一些优势所在。例如,Sora在处理细节的连贯性方面表现出色,能够生成自然流畅的视频画面。同时,Sora还提供了从视频生成到制作成品的端到端完整产品体验,这在国内产品中并不多见。然而,国内产品也在不断努力提升用户体验和产品质量,未来仍有很大的发展空间。