当前位置:主页 > 关于华镇 > 最新动态 >

学术报告:AI未来说·青年学术论坛之中科院刘斌

发布日期: 2019-05-15 13:57

人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术作为合作自媒体。本次承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。“AI未来说·青年学术论坛”第四期“语音技术”专场已于2019年4月27日下午在中科院举行。中科院刘斌为大家带来报告《基于联合对抗增强训练的鲁棒性端到端语音识别》。

刘斌,中科院自动化研究所模式识别国家重点实验室博士生,导师是刘文举研究员。主要研究兴趣为鲁棒性语音识别、声纹识别、语音唤醒、对抗学习。把对抗学习应用到鲁棒性语音识别中,获得了ICASSP 2018 最佳学生论文奖,先后参与华为、腾讯、滴滴、学而思等合作项目。

报告内容:近年来,端到端系统在语音识别领域取得了重大突破。然而,端到端的结构对于噪声和混响的干扰不是特别鲁棒,在现实应用中性能显著降低。为了减轻这个问题,主流的方法是使用语音增强作为语音系统的前端模块。

然而,增强模块会导致语音失真,与训练不匹配,有时会降低识别性能。在本文中,我们提出了联合对抗增强训练用来提高端到端系统的鲁棒性。具体地,我们使用基于掩蔽的增强网络、基于注意力的识别网络以及判别网络的联合训练方案。判别网络用于区分增强语音特征和纯净语音特征,可以指导增强网络输出更加接近真实分布。对于训练中的识别、增强和对抗性损失进行联合优化,使得语音识别系统的鲁棒性更强。AISELL-1的系统实验表明提出的方案提高了端到端系统的鲁棒性,相对于多条件训练相对误差率降低4.6%。

基于联合对抗增强训练的鲁棒性端到端语音识别

13524859176、13296017858