ITBear旗下自媒体矩阵:

字节跳动Seeduplex上线:全双工语音交互,开启自然流畅对话新篇章

   时间:2026-04-10 12:50:20 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

字节跳动近日在语音交互领域迈出重要一步,正式面向公众推出原生全双工语音大模型Seeduplex。这款搭载于豆包App的新技术,标志着语音交互从实验室阶段迈向规模化应用,为全球上亿用户带来接近自然对话的实时交互体验。

与传统半双工模型"先听后说"的交互模式不同,Seeduplex采用"边听边说"的全双工架构。这种创新设计使设备能够同步处理语音输入与输出,显著提升对话流畅度。据实测数据显示,在复杂声学环境下,该模型的误回复率和误打断率较前代技术降低50%,即使在嘈杂的商场或车站等场景中,仍能精准识别用户指令。

动态判停功能是Seeduplex的另一技术亮点。通过融合语音特征与语义理解,系统可智能判断用户停顿的真实意图。当检测到思考性停顿时,模型会保持静默等待;而确认用户结束表达后,则能在200毫秒内快速响应。这种机制使抢话现象减少40%,对话节奏更趋近人类自然交流模式。

在多维评测体系中,Seeduplex展现全面优势。对比行业主流语音交互方案,其对话流畅度提升37%,语义连贯性提高29%。特别是在判停准确率方面,较半双工模型提升8个百分点,有效解决了传统语音助手"该停不停、该说不说"的痛点问题。

目前该技术已完整集成至豆包App全平台,支持中英文双语交互。用户无需额外操作即可体验连续对话功能,系统可自动适应不同口音、语速及表达习惯。字节跳动AI实验室负责人表示,Seeduplex的规模化落地验证了全双工技术的商业可行性,未来将持续优化多模态交互能力。

行业分析师指出,Seeduplex的推出重新定义了语音交互标准。其突破性在于将实验室级技术转化为普惠型服务,这种"听得懂、会等待、能插话"的智能表现,正在模糊人机对话与人际交流的界限。随着5G网络普及和边缘计算发展,全双工技术有望成为智能终端的标配功能。

 
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version