近期,科技界再次迎来震撼消息,特斯拉及SpaceX的创始人埃隆·马斯克,通过其人工智能项目Grok,推出了一项名为“Imagine”的全新视频生成功能。这一创新不仅打破了传统界限,更在视觉体验上实现了质的飞跃。
据悉,“Imagine”不仅具备添加音效和画面匹配的能力,还支持多样化的风格生成,这一消息迅速在网络上引发了热议。网友们纷纷尝试,反馈称效果超乎想象,仿佛开启了一扇通往新世界的大门。
马斯克本人也在社交媒体上分享了“Imagine”的测试视频,一段机器人修复机械鸟的场景,其炫目的视觉效果令观者仿佛置身于科幻电影中。视频中,金光闪烁的“机器之鸽”修复过程,不禁让人联想到古希腊数学家Archytas的机械飞鸟传说,这一历史与未来的交融,再次证明了技术的无限可能。
“Imagine”的功能强大到令人咋舌,试用者通过Grok生成了赛博朋克风格的视频,代码在暗室中跳跃,机械手在键盘上掀起风暴,一个瞳孔泛着红光的机器人,正在用二进制语言挑战人类文明的防火墙。这些细节逼真到令人难以置信,仿佛电影级别的制作。
xAI项目负责人Mati Roy展示了“Imagine”的多风格生成能力,从奇幻的宝可梦宠物到写实的机器人,再到科幻的戴森球,每一种风格都让人眼前一亮。这些视频不仅展示了技术的深度,更体现了创意的广度。
“Imagine”还支持将图像转换为视频,这一功能让不少网友大呼过瘾。一位名为Minxuan Xie的网友,结合Grok的标志,生成了一段宇航员演奏音乐的视频,场景如梦如幻,配乐恰到好处,让人沉醉其中。
据最新报道,xAI即将为Grok iOS应用推出全新的“Imagine”功能,支持带音频的视频生成,并可一次性生成4段视频,生成速度也有了显著提升。这一功能的加入,无疑将进一步提升Grok的用户体验。
在操作上,“Imagine”提供了极大的便捷性。用户可以在“Ask”和“Imagine”两个主要入口之间自由切换,使用更加灵活。在“Imagine”页面中,用户可以通过手动输入或语音描述来生成内容,每次生成后,系统都会提供4个不同版本的视频供选择,每段视频都配有独特的背景音效。
更令人兴奋的是,“Imagine”几乎实现了实时的图像生成,图像生成与滚动同步进行,大大提升了创作效率。同时,系统还提供了多种预设模式,包括Spicy、Fun和Normal,满足不同用户的创作需求。