【ITBEAR科技资讯】7月10日消息,奇富科技智能语音团队的最新研究成果《Qifusion-Net:基于特征融合的流式/非流式端到端语音识别框架》论文,近日被全球顶尖的语音与声学会议INTERSPEECH 2024收录。这一成果再次彰显了奇富科技在语音识别技术领域的深厚实力。
据悉,INTERSPEECH是由国际语音通讯协会(ISCA)主办的顶级旗舰国际会议,备受全球语音语言领域人士的关注。奇富科技团队的论文被收录,不仅代表了其研究得到了国际认可,也展示了该团队在语音识别技术上的领先地位。
据ITBEAR科技资讯了解,Qifusion框架模型是奇富科技智能语音团队的重要研究成果,具有多个显著特点。该模型支持更丰富的方言种类,在原有八种主流方言的基础上,进一步强化了多个用户密集地区的方言识别能力,平均识别准确率相对提升了25%,尤其在川渝地区,方言识别准确率更是提升了超过35%。其次,Qifusion框架模型具备自动识别不同口音的能力,并能对解码结果进行口音信息修正,显著降低了方言口音的语音识别误差率和整体语音识别字错率,提升了用户体验。该模型还采用了创新的层自适应融合结构,能高效提取方言信息,并支持即说即译功能,实现了对方言口音音频的实时解码和精准转译。
奇富科技智能语音团队将受邀参加9月举行的INTERSPEECH 2024科技盛会,并将发表主题报告,分享其在语音识别领域的最新创新成果。届时,该团队将与全球同行共同探讨语音科技的未来发展,为推动语音技术的进步贡献力量。