近日,腾讯混元在AI视频生成领域投放了一枚震撼弹,一只佩戴红色围巾的企鹅形象跃然于屏幕,正式宣告其进军火热的AI视频战场。
腾讯混元最新发布的AI视频生成大模型,无疑为市场带来了一股强劲的新势力。其官方网站https://aivideo.hunyuan.tencent.com已经上线,同时,AI视频功能也在腾讯元宝App中开放试用,用户只需点击“腾讯元宝App-AI应用-AI视频”即可申请体验。对于企业客户,腾讯云也提供了服务接入,并同步开放了API内测申请。
据官方数据显示,腾讯混元的视频生成模型在多个维度上均领先国内外顶尖模型,特别是在文本视频一致性、运动质量和画面质量方面,尤其在人物和人造场所等场景下表现尤为卓越。更令人惊讶的是,该模型的参数量高达130亿,并且腾讯已经将其全面开源,包括模型权重、推理代码和算法等,企业和个人开发者可以在Hugging Face和Github上免费使用和开发生态插件。
经过实际测试,腾讯混元的AI视频生成模型在视觉风格、语义理解、运动表现、运镜和文字生成等方面均展现出了强大的实力。它能够准确理解多元化的风格提示词,并呈现出相应的视觉风格,包括写实、动画、电影、黑白和赛博朋克等。在语义理解方面,模型能够准确捕捉提示词中的关键信息,并生成符合创作者预期的视频内容。同时,模型在运动控制和运镜方面也有着出色的表现,能够生成流畅自然的动作和镜头切换。
在实际应用中,腾讯混元的AI视频生成模型已经展现出了巨大的潜力。例如,在广告宣传、动画制作和创意视频生成等场景中,该模型已经能够生成高质量的视频内容。多家媒体也已经率先使用了混元视频制作创意视频,包括《江山如此多娇》、《山水之间》等多部作品。
腾讯混元在开源方面也展现出了积极的态度。相较于图像生成领域已经形成的成熟生态,视频生成社区的生态尚未形成气候。而腾讯混元的全面开源,无疑将为视频生成领域注入新的活力,吸引更多的开发者和企业参与到这个领域中来。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并能基于其打造专属应用及服务,从而节约大量人力和算力。
总的来说,腾讯混元的AI视频生成模型以其卓越的性能和全面的开源策略,为AI视频生成领域带来了新的希望和机遇。未来,随着技术的不断迭代和生态的不断完善,相信腾讯混元将在AI视频生成领域发挥越来越重要的作用。