在经历了一连串的市场波折与退市风波后,自动驾驶领域的昔日明星企业图森未来,已悄然调整航向,踏上了一条全新的创业征途。
今年八月,图森未来首次透露出向AIGC领域进军的意图,而仅仅四个月后,这一转型便以全新品牌CreateAI的面世而正式落地。12月17日,公司隆重推出了其首个图生视频大模型产品——“Ruyi”,并宣布该产品已在huggingface平台上实现开源,用户可自由下载使用。尤为“Ruyi”专为消费级显卡设计,如RTX 4090,这一特性无疑将大大降低其使用门槛。
面对从自动驾驶到AIGC的跨界转型,外界不禁好奇,图森未来究竟为何做出如此选择?公司技术负责人在接受专访时坦言,这一决策是基于公司转型与业务发展的深思熟虑。一方面,图森未来在自动驾驶领域的深耕,使其在AI算法、算力及数据方面积累了丰富经验;另一方面,公司联合创始人陈默在游戏行业的资源积累,为技术的快速落地提供了有力支撑。
陈默也曾公开表示,图森未来正在探索一条能够迅速利用现有资源,使公司重焕生机的道路。随着视觉模型技术的不断进步与公开,AIGC在商业化空间与技术可达性方面均展现出巨大潜力,成为当前的最佳选择。值得注意的是,图森未来打造视觉模型的团队,正是此前从事自动驾驶研发的团队,技术经验的复用,为转型提供了坚实基础。
图森未来技术负责人进一步指出,AI视觉模型与自动驾驶均依赖于算法、算力与数据这三大核心要素,且两者均需要大量数据进行训练与优化。视频生成技术与自动驾驶中的感知模块在研发路径上存在诸多相似之处,均以数据驱动为主,且依赖的技术基础相对清晰。相较于自动驾驶涉及的复杂算法模块与多领域技术,视频模型技术的研发路径更为简洁,主要集中在数据处理与模型训练上。
在数据的重要性方面,图森未来技术负责人强调,公司在自动驾驶领域积累的数据标注经验,如自建标注团队与标注平台,以及完善的数据处理流程,均可直接应用于视频模型的数据准备阶段,从而大幅节省时间与成本。然而,尽管在自动驾驶领域有所积累,但在视觉模型的技术与效果上,图森未来仍需从零开始探索。目前,公司视频模型主要围绕生成质量、一致性、可控性、易用性和成本这五大关键指标进行研发。
在视觉模型领域竞争日益激烈的背景下,图森未来的入局无疑引发了广泛关注。然而,公司技术负责人明确表示,图森未来的目标并非成为一家大模型技术公司,而是致力于成为一家内容公司,与快手等平台以及Pika等创业公司的方向截然不同。目前,视觉大模型的商业模式主要分为两类:一类是面向C端用户,提供付费的视频生成工具或服务;另一类则是面向B端影视文娱及游戏等公司,提供技术赋能。
然而,图森未来认为,如果单纯定位为视频模型公司,无论是to C还是to B都面临巨大挑战。在C端市场,视频生成工具的目标用户群有限,且收费模式和盈利前景均不明确。同时,视频模型需要大量的算力支持,运营成本高企,国内市场短期内难以实现盈利。而在B端市场,技术公司难以深入了解具体场景需求,难以将技术有效融入实际制作流程,控制内容质量和风格。
因此,图森未来选择了与众不同的第三条路:直接将模型技术开源,不依赖模型盈利,而是并购经典IP,亲自下场利用大模型制作内容。目前,公司已组建专门的动漫和游戏团队,开发新项目。公司技术负责人表示,图森未来希望打造一家以AI技术驱动的视频内容创作公司,构建端到端的视频内容生成链条,最终通过优质内容吸引用户并实现商业价值。
在内容布局方面,图森未来已涉足动漫和游戏领域。其全新品牌CreateAI已获《金庸群侠传》正版授权,将开发一款大型武侠开放世界RPG游戏。同时,公司还与上海三体动漫有限公司达成合作,共同开发《三体》系列的首部动画长篇电影和视频游戏。公司还计划在12月推出SLG游戏工具和游戏本身。
图森未来的转型之路,不仅展现了其在面对市场变化时的敏锐洞察与果断决策,更彰显了其在技术创新与内容创作方面的深厚底蕴。未来,随着公司在AIGC领域的深入探索与布局,我们有理由相信,图森未来将为用户带来更多惊喜与期待。