在AI技术日新月异的今天,实时语音对话已成为科技巨头们竞相角逐的新领域。自OpenAI于今年早些时候推出GPT-4o高级语音模式以来,这一赛道便吸引了众多关注。然而,由于技术门槛较高,目前能够与之抗衡的产品寥寥无几,谷歌的Gemini Live算是其中之一。
近日,国内AI领域迎来了一位新成员——昆仑万维推出的Skyo实时语音对话助手。Skyo基于昆仑万维自研的天工大模型4.0 4o版打造,直接对标GPT-4o,旨在为用户提供更加自然流畅的语音交互体验。
在与Skyo的实际交流中,其表现令人眼前一亮。无论是健康常识咨询,还是情感化反应,Skyo都能应对自如。尤其在用户打断场景下,Skyo能够迅速切换话题,保持对话的连贯性。Skyo还具备一定的拟人化属性,语气自然,充满情感,让对话更加生动有趣。
除了基本的对话功能外,Skyo还能根据用户要求切换声音,无论是男声还是女声,都能轻松驾驭。在测试中,Skyo用男声朗诵了徐志摩的《再别康桥》,感情充沛,节奏把握得当;用女声朗诵李白的《静夜思》,则显得温婉动人,充满浪漫气息。
Skyo之所以能够取得如此出色的表现,得益于昆仑万维在自研语音技术框架、大模型训练以及数据积累上的深厚功底。通过采用先进的端到端实时语音建模技术,Skyo能够在高精度理解用户语音输入的基础上,快速做出响应,响应时间一般在1秒左右。同时,在高强度对话中,Skyo也能保持稳定性和流畅性,确保对话的顺利进行。
Skyo还具备了一定的实时资讯获知和知识拓展能力。在测试中,当被问及小米雷军在汽车工厂摆拍的趣事时,Skyo能够迅速给出回应,显示出其强大的信息检索和处理能力。这一功能将为用户带来更加丰富多样的对话体验。
随着AI技术的不断发展,实时语音对话助手的应用场景也将越来越广泛。从智能家居到智能车载,从在线教育到远程办公,实时语音对话助手都将成为不可或缺的重要工具。而Skyo的推出,无疑将为这一领域注入新的活力。
Skyo的推出也是昆仑万维在AI领域布局的重要一步。近年来,昆仑万维在AI领域持续发力,不仅自研了天工系列基座大模型,还构建了清晰、多元的AI业务矩阵。通过不断迭代更新AI应用功能,昆仑万维正逐步深化大模型能力释放出口,将新世代的人机交互贯穿文本、图像、语音等更全模态。