站内搜索

  

友情链接

学术动态

计算机(软件)学院师生张晖、郝翔参加语音领域的顶级会议INTERSPEECH 2019
来源:  发布时间: 2019-09-25 15:24:44

     

语音领域的顶级学术会议INTERSPEECH于2019年9月15-19日在奥地利第二大城市格拉茨召开,该会议由国际语音通讯协会(International Speech Communication Association)主办,是世界上规模最大、内容最全面的语音会议。今年恰逢INTERSPEECH成功举办20周年,会议以“Crossroads of Speech and Language”为主题,意在探讨语言多样性、应用多样性以及表达方式多样性,吸引了来自世界各地的2000多名学者及企业厂商代表。INTERSPEECH每年召开一次,被CCF(中国计算机学会)列为C类推荐会议。在本次会议上,我校计算机(软件)学院共有两篇论文被录用:

 

Investigation on cost function for monaural speech separation(刘允,张晖,张学良)

第一作者刘允为2016级研究生(已毕业)。本文探讨了机器学习中的评价指标与代价函数的不一致问题,提出了一种一致性度量方法,并从理论上和实践上证明了提出的方法的有效性,最终以此为基础确定了语音分离任务的最优代价函数。该方法对于消除机器学习中评价指标与代价函数的不一致问题具有普遍意义。

 

UNetGAN: A Robust Speech Enhancement Approach in Time Domain for Extremely Low Signal-to-noise Ratio Condition(郝翔,苏向东,王治愚,张晖,巴图斯仁)

第一作者郝翔为2018级研究生。本文在非常具有挑战性的极低信噪比下进行语音增强,提出了一种基于U-Net与生成对抗网络的方法,并可以直接在时域上完成映射。该方法极大地提升了极低信噪比下语音的质量与可懂度,甚至在某些特定噪声场景下,可以将原本无法被人听清的语音信号转换为可以被人听清进而能被理解的语音信号。

 

我校教师张晖与研究生郝翔分别作为两篇论文的代表前往奥地利格拉茨参加了此次会议。



上述论文的研究工作得到了国家自然科学基金、内蒙古自治区自然科学基金以及内蒙古大学综合能力提升项目的资助。


地址:内蒙古呼和浩特市大学西路235号内蒙古大学计算机学院

版权所有 © 内蒙古大学计算机学院