语音与智能信息处理学术论坛成功举办
发布时间:2018-08-01

2018年7月30日,由语音及语言信息处理国家工程实验室、中国计算机学会语音对话与听觉专业组主办的“语音与智能信息处理学术论坛”在中国科学技术大学西区科技实验西楼118会议室举办。论坛邀请了中国人民大学信息学院金琴副教授、昆山杜克大学电子与计算机工程学院李明副教授、先声教育联合创始人及CTO秦龙博士和中国科技大学信息学院杜俊副教授分别做了分享报告。论坛由国家工程实验室主任助理凌震华副教授主持,来自中科大及外校相关感兴趣的学生聆听了报告。 

1.jpg

 随后,金琴老师首先做了题为“Multi-level Multi-aspectMultimedia Analysis”的报告。随着现代智能设备和网络的发展,包括文字、图像和视频的多媒体大量产生。金老师详细阐述了在这一背景下,如何从多媒体数据中挖掘丰富信息的方法,着重介绍了其团队近期在音频事件识别、视频描述生成以及情感分析方面的研究工作和成果。 

2.jpg

 接着,李明老师做了题为“副语言语音属性识别”的报告。副语言语音属性是指除语言语义信息之外,语音所包含的说话人、语种、性别、年龄、情感、信道、嗓音、病理、生理和心理等多种丰富的信息。李老师以说话人识别为例,从特征提取、建立模型、鲁棒性处理和分类器设计等几个方面介绍了该领域具有共通性的一些经典算法。最后,李老师还就其团队最近基于端到端深度学习框架开展的多种不同副语言语音属性识别的工作进行了简要介绍。

3.jpg

随后,秦龙博士做了题为“Decoding Adaptive Learning”的报告,介绍了知识追踪的发展、方法及应用。知识追踪是一种用来追踪和评估学生对于知识点的掌握程度的算法。随着在线学习的普及,知识追踪作为自适应学习的核心技术也得到了快速的发展。秦博士详细讲解了知识追踪的主要算法,包括Bayesian Knowledge Tracking、Deep KnowledgeTracing、Half-life Regression等。 

4.jpg

最后,杜俊老师做了题为“Speech Enhancement for Speaker Diarization in Adverse AcousticEnvironments”的报告,介绍了在基于背景噪声、混响和重叠语音等具有挑战性的现实环境中,作为说话人分割聚类预处理器的基于深度学习的语音增强方法的最新进展。报告最后,杜老师还对语音增强的应用以及相关国际比赛等方面进行了简单介绍。 

5.jpg

与会者在专家报告之后进行了提问和交流。本次论坛在热烈的探讨中圆满结束。 

6.jpg