自OpenAI在今年2月16日首次发布Sora以来,这款视频生成模型一直备受争议,被戏称为“技术期货”。然而,在经历了近十个月的等待后,Sora终于迎来了正式版,其能够生成最高分辨率为1080p、时长最长可达20秒的视频。OpenAI的首席执行官更是将Sora正式版的发布比作视频生成领域的GPT-1时刻。
然而,与GPT发布时国内AI企业纷纷跟进的情况不同,面对Sora,国内AI企业的态度显得更为复杂。一部分企业选择了积极跟进,包括阿里巴巴、字节跳动、快手和腾讯等互联网巨头,以及智谱AI、MiniMax和爱诗科技等AI初创公司。这些企业纷纷发布了自家的视频生成模型,并声称在某些方面已经超越或达到了预览版Sora的水平。
然而,并非所有国内企业都对Sora持积极态度。百度和百川智能等企业明确表示不会跟进Sora。百度创始人李彦宏更是直言,无论Sora多么火爆,百度都不会涉足这一领域。虽然月之暗面、商汤科技和零一万物等公司也拥有文生视频模型,但这些模型并未被作为重点发展对象。
这种分歧的背后,是国内AI企业在技术路线和商业前景上的不同判断。Sora的核心技术路线是Diffusion+Transformer相结合,通过文本、图片和视频作为提示词进行视频生成。然而,对于这一技术路线的有效性和商业化前景,国内企业存在非共识。
一些企业认为,Sora虽然具有一定的技术突破,但仍然存在不少问题,如手部细节不准确、动态过程中的一致性差等。Sora的商业化前景也充满不确定性。一方面,视频生成模型在ToB场景中的收费模式和投资回报比尚不明朗;另一方面,在ToC场景中,个人付费意愿不高,且视频生成并非大众日常使用的高频场景。
在这种背景下,国内AI企业开始根据自己的业务重要性和优先级来确定是否跟进Sora。以字节跳动和快手为例,这些企业以视频为核心业务,拥有成熟的数字基建和丰富的技术人才资源,因此几乎第一时间选择了跟进。而百度等则更聚焦于大语言模型和多模态大模型的发展,并未将视频生成作为重点。
还有一些企业对Sora持观望态度。他们出于“恐惧错过”的心理有所布局,但并不重点投入。这些企业认为,视频生成领域仍然充满不确定性,需要更多的时间和资源来探索和发展。
总的来说,面对Sora这一新技术,国内AI企业表现出了不同的态度和策略。一些企业积极跟进,试图在这一领域取得突破;一些企业则选择观望或放弃,将资源投入到其他更有前景的领域。这种分化不仅反映了国内AI企业在技术路线和商业前景上的不同判断,也预示着未来视频生成领域的竞争将更加激烈和复杂。
然而,无论国内AI企业如何选择,大模型技术的发展都必将继续下去。对于Sora这一新技术,国内企业不仅需要关注其技术本身的发展,更需要思考如何将其与自身的核心业务相结合,实现商业化和规模化的发展。在这个过程中,企业需要不断学习和借鉴OpenAI等领先企业的经验和技术,同时也要保持自己的独立思考和创新精神。