ITBear旗下自媒体矩阵：

滚动资讯

当前位置：财经 > 信息流 > 正文内容

微软AI语音服务推出虚拟人形象实现文本转高清人物说话视频

时间：2024-08-24 16:01:27 来源：PConline太平洋科技作者：朱天宇编辑：瑞雪 发表评论无障碍通道

近日，微软公司宣布其Azure AI语音服务新增了一项创新功能——Text to Speech Avatar，该功能为开发者提供了将文本转换为自然语音视频的能力，该功能突破性地将文本直接转换为具有人类自然声音的说话视频。这一技术利用了Azure AI的文本转语音引擎，使得虚拟人物在视频中呈现出逼真的说话效果，并且该服务的输出视频质量高达1920 x 1080分辨率，每秒25帧，确保了视频的流畅性和清晰度。

为了满足不同场景的需求，微软提供了多种预设的虚拟形象。这些形象可以根据用户喜好进行选择，进一步提升视频的个性化程度，开发者可通过批量合成API，实现文本到语音虚拟形象视频的异步或实时合成。这一功能大大提高了内容生产的效率。

Speech Studio内置的内容创建工具，让用户无需编写代码即可轻松制作视频内容，降低了技术门槛，而借助Speech Studio的实时聊天头像工具，用户可以与虚拟形象进行实时对话，为在线交流带来全新体验。

该服务按视频长度收费，价格合理。目前，Text to Speech Avatar功能已在东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部地区上线，目前来看这项技术的应用前景广阔，有望在客户服务、在线教育、市场营销等多个领域发挥重要作用。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

北京自研可拟人奔跑全尺寸人形机器人具备语音交互抓取能力

【太平洋科技快讯】2024年8月23日，北京具身智能机器人创新中心在2024世界机器人大会上展示了其最新研发成果——“天工1.2MAX”全尺寸人形机器人。升级后的“天工1.2 MAX”继续保持全球首例纯电驱…

08-24

三星展示可拉伸Micro LED屏幕原型 Z轴方向伸长率高达25%

【太平洋科技快讯】在2024年8月23日举行的韩国最大显示技术学术会议IMID上，三星显示公司展示了一款创新十足的可拉伸Micro LED屏幕原型，这款新型屏幕原型最引人注目的特点是其能在Z轴方向上向外拉伸，…

08-24

三星S24 FE将搭载降频版猎户座2400芯片五色可选预计十月发布

【太平洋科技快讯】近日，三星新款 SM-S721U 在 Geekbench 跑分测试中的成绩意外曝光，该手机搭载了经过性能和功耗优化的降频版Exynos(猎户座) 2400 处理器。这款处理器采用了先进的 …

08-24

联想携手McAfee打击网络钓鱼和AI诈骗推出自动深度伪造技术检测器

【太平洋科技快讯】2024年8月23日，网络安全领域的McAfee与全球知名电脑制造商联想携手，共同推出了一款创新工具——Deepfake Detector，这是全球首款自动Deepfake(深度伪造技术)检…

08-24

锐龙9000X3D系列处理器预计明年1月推出极限性能与AI处理显著提高

该系列预计将包含至少三个SKU型号：Ryzen 9 9950X、Ryzen 9 9900X和Ryzen 7 9800X3D，均采用Zen5架构和3D V-Cache技术。最高配置为16个核心、32个处理线程…

08-24

真我GT7 Pro将在年底发布搭载1.5K京东方X2基材等深微曲屏

【太平洋科技快讯】近日，相关消息称真我GT7 Pro将于今年年底正式发布，这款手机将首发搭载与京东方联合定制的1.5K X2屏幕基材的等深四曲直屏、内置了6000mAh的超大电池支持百瓦快充技术。工程机版本暂…

08-24

Redmi K80预计第四季度上市有望搭载6500mAh超大电池

当前测试显示，电池容量在5960mAh至6200mAh之间，其中典型容量为6100mAh至6200mAh，这一成绩在实验室环境下甚至可触及6500mAh的峰值。在硬件配置上，Redmi K80系列Pro版预…

08-24

数字华夏推出情感交互人形机器人智能化功能算法塑造温暖交互体验

【太平洋科技快讯】在8月21日北京开幕的2024世界机器人大会(WRC)上，数字华夏(深圳)科技有限公司带来了其创新产品——名为“夏澜”的交互型人形机器人，“人形交互机器人”的概念由其首次提出，并致力于打造一…

08-24

百度CEO表示萝卜快跑在武汉出租车市场约占1% 扩大规模仍需较长时间

目前，萝卜快跑在武汉的车辆规模约为400台，占据当地出租车服务市场的份额大约为1%。在智能驾驶领域，百度的自动驾驶服务“萝卜快跑”在第二季度表现抢眼，共计完成约89.9万单自动驾驶订单，同比增长26%。百度…

08-24

苹果获智能戒指专利探索跨设备多样化交互新方式

该专利揭示了智能戒指在健康追踪之外的更多可能性，特别是在苹果生态系统中的跨设备交互应用。智能戒指不仅限于独立操作，还能与苹果生态中的其他设备无缝对接。如同其他智能戒指，苹果的这款产品同样具备健康追踪功能，…

08-24

Meta推出高效个性化图像生成AI模型简化流程丰富图像输出

【太平洋科技快讯】近日，Meta公司推出一款名为“ImagineYourself”的人工智能模型，该模型在个性化图像生成领域实现了重大突破，传统个性化图像生成方法因需针对每位用户调整模型而效率低下。在实际…

08-24

腾势新N9车长达5.3米云辇A满血版双腔空气悬挂+三电机后轮转向技术

【太平洋科技快讯】近日，比亚迪旗下腾势品牌的旗舰级SUV——腾势N9的谍照在网络上曝光，该车将搭载比亚迪最新的DM技术和插电混动系统、激光雷达、电动吸合门、智能冰箱、航空级座椅、后排大屏幕以及“云辇A满血版”…

08-24

广汽昊铂推出夸克电驱2.0与智慧数字底盘提升续航并增强越野能力

【太平洋科技快讯】近日，广汽埃安旗下高端品牌昊铂全新电驱动系统——“夸克电驱”2.0正式下线。据了解，“夸克电驱”2.0采用了非晶合金定子和碳纤维高速转子材料，使得电机转速可达30000rpm，功率密度高达1…

08-24

LG独供iPhone16系列潜望式镜头光学防抖进一步增强远摄清晰度

【太平洋科技快讯】据最新消息，LG Innotek 已确定将在今年下半年独家为苹果 iPhone 16 系列提供潜望式镜头模组。此外，LG与家化电子携手合作，为该镜头模块提供先进的 OIS(光学防抖)技术，…

08-24

印度“马斯克”：大放阙词还能收获7亿投资？

在如今印度这个不缺人的时代，他用极速和创新，将Ola推上了印度最有价值初创公司的宝座。他认为印度的年轻人也将加速采用电动车，这也是Ola的重点领域之一。印度媒体评价道：“阿加瓦尔在 Ola 的领导力不仅仅是…

08-24

全站最新

阿里巴巴，突发！新增香港为主要上市地，最快9月纳入港股通？

【早知道】美股三大指数全线收跌；我国成功发射中星4A卫星

热门内容

本栏最新

亿航二季度调整后净利扭亏！首张运营合格证预计年内获批，合资公司正大量招人

小米交出史上最出色财报：总营收涨超3成，持续加大研发投入

70岁董明珠再提明年或退休！格力营销峰会爆出重磅信号，王自如没有出现

炮轰小米卖车亏损后，极越汽车公关负责人被内部处罚，上半年极越仅售出2700辆

上半年毛利率转正，MONA首车上市在即，小鹏汽车能否等来“顺风期”？

爱建集团上半年净利润2.1亿，爱建信托年内收309万罚单

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
合作咨询QQ：642361(微信同号) 争议稿件处理QQ：42503264
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1
Copyright © 小熊科技资讯 2007-2021 ITBEAR.COM.CN All rights reserved.

微软AI语音服务推出虚拟人形象 实现文本转高清人物说话视频

微软AI语音服务推出虚拟人形象实现文本转高清人物说话视频