微软研究院俞栋博士访问国家工程实验室

发布时间：2014-05-28

5月28日，微软雷德蒙德研究院(Microsoft Research Redmond)首席研究员俞栋博士受邀访问语音及语言信息处理国家工程实验室，并在第二会议室作了题为“Single-Channel Mixed Speech Recognition Using Deep Neural Networks”主题报告。报告由实验室副主任戴礼荣教授主持，科大部分感兴趣的师生聆听了此次精彩报告。

在报告中，俞栋博士介绍了深度神经网络的相关内容。他表示使用该模型解决此问题，尚属首次。在其中使用人工混合的语音信号，采取了多模式的模型训练策略。俞栋博士在报告中解释了不同系统中该方法的长短处，其中包括基于WFST的双说话人解码器系统。在2006年的语音分离和识别挑战赛中，该系统在双说话人语音识别方面表现优异。设计出的最优系统，达到了19.7%的的总WER，这比IBM的superhuman系统提高了1.9%，并且，我们的系统中假设更少，运算也更为简洁。

报告结束后，俞栋博士和师生就相关的语音识别问题进行了互动讨论，现场气氛活跃。此次学术报告拓宽了研究生的学术视野，促进了国内外语音识别领域的学术交流。