在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,正式发布讯飞星火大模型最新技术升级及系列创新产品,系统呈现AI技术从实验室到产业落地的完整路径。此次发布不仅展示了国产AI在核心领域的突破,更通过软硬一体化解决方案推动技术融入真实生活场景。
作为本次发布的核心成果,讯飞星火X1.5大模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数300亿,推理效率较前代提升100%。该模型在语言理解、文本生成等六大核心能力上全面对标国际主流模型,数学能力持续保持领先。在多语言支持方面,覆盖130余个语种,整体性能达到GPT-5的95%以上,其中拉美、东盟等14个重点语言场景表现尤为突出。更关键的是,星火X1.5在国产算力平台上实现双重突破:长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率显著优化,为AI自主可控奠定技术基石。全球首发的非自回归语音大模型架构通过并行输出文本序列,使推理效率提升16%,成本降低520%。
软硬一体化解决方案成为另一大亮点。科大讯飞推出的智能办公本X5搭载上4下4环八麦克风阵列,抗噪性能超越iPhone 17 Pro,高噪声环境下识别准确率达95.08%;AI翻译耳机采用单耳三麦多感融合降噪系统,复杂场景识别率达97.1%;双屏翻译机2.0在90分贝环境下仍保持98.69%的识别率。声场重构技术方面,智能座舱音响方案iFLYSOUND已与19家车企合作,量产超100万台。视觉健康领域,AI黑板配备圆偏类自然光护眼大屏,视觉疲劳降低50%,显示角度达130度;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证。
发布会上首发的两项交互技术引发关注。星火X1.5通过构建用户个性化记忆库,整合长期画像、近期反馈与短期对话,实现“千人千面”的智能交互;百变声音复刻功能基于语音大模型,仅需1秒录音即可复刻音色,并支持自定义声音风格。数字人导览“小飞”现场演示了多人多语种对话、个性化推荐等能力,其背后是远场识别、3D视觉等八大技术的系统突破。科大讯飞董事长刘庆峰表示:“超拟人多模态交互将成为AI进入家庭的标准配置。”
在应用落地层面,科大讯飞展示了AI在教育、医疗、汽车等领域的深度实践。教育领域,星火大模型构建的错因分析体系包含4000余项标签,已通过权威专家鉴定;智能批阅机与教师助手形成“小时级闭环”,推动教学范式变革。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,“智医助理医院版1.0”提供辅助诊疗、病历生成等功能,“讯飞晓医”健康助手累计完成1.6亿次咨询,支持解析99%医学报告。汽车领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,实现体征监测与偏好记忆,打造“第三空间”。办公领域,智能办公本X5升级手写笔记与AI纪要融合功能,听见APP可自动生成会议纪要与待办事项。情感陪伴方面,“AI星朋友”通过160种人设模型与自学习情感引擎,能主动发起通话,让科幻场景成为现实。
生态建设方面,2025年AI开发者大赛吸引17国3.69万个团队参与,涌现4622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。发布会上,科大讯飞宣布全面开源首个原生支持RPA的智能体平台Astron,该平台整合“大脑”与“手脚”功能,提供八大行业智能体,助力开发者跨越AI应用鸿沟。活动最后,科大讯飞携手多国合作伙伴启动“星火点亮全球”计划,旨在通过多语言技术与自主可控方案,为世界提供AI发展的新选择,加速技术红利全球共享。





