微软研究院俞栋博士访问国家工程实验室
发布时间:2014-05-28

5月28日,微软雷德蒙德研究院(Microsoft Research Redmond)首席研究员俞栋博士受邀访问语音及语言信息处理国家工程实验室,并在第二会议室作了题为“Single-Channel Mixed Speech Recognition Using Deep Neural Networks”主题报告。报告由实验室副主任戴礼荣教授主持,科大部分感兴趣的师生聆听了此次精彩报告。

 1553484022261547.png

在报告中,俞栋博士介绍了深度神经网络的相关内容。他表示使用该模型解决此问题,尚属首次。在其中使用人工混合的语音信号,采取了多模式的模型训练策略。俞栋博士在报告中解释了不同系统中该方法的长短处,其中包括基于WFST的双说话人解码器系统。 在2006年的语音分离和识别挑战赛中,该系统在双说话人语音识别方面表现优异。设计出的最优系统,达到了19.7%的的总WER,这比IBM的superhuman系统提高了1.9%,并且,我们的系统中假设更少,运算也更为简洁。


报告结束后,俞栋博士和师生就相关的语音识别问题进行了互动讨论,现场气氛活跃。此次学术报告拓宽了研究生的学术视野,促进了国内外语音识别领域的学术交流。