近日,我院人工智能与蒙古文信息处理实验室的研究成果《Jointly Optimizing Activation Coefficients of Convolutive NMF Using DNN for Speech Separation》(作者:李号,聂帅,张学良,张晖)被国际会议Interspeech 2016录用。该会议是国际上公认的语音信号处理研究领域的顶级会议,同时也是中国计算机学会(CCF)推荐的C类刊物。
该论文针对单通道下语音与噪声分离这一公认难题(鸡尾酒会问题)进行了深入研究,提出了利用卷积非负矩阵分解(Convolutive NMF)对语音的谐波结构进行刻画,并利用深度神经网络(DNN)对NMF系数进行预测。相比以往的算法,在降噪后的语音感知质量上有明显提升,得到评审专家的认可。
论文第一作者李号现为我院2010级硕士研究生(导师:张学良副教授)。论文第二作者聂帅为我院2009级本科生,已保送中国科学院自动化研究所攻读博士学位。第四作者张晖为我院2014级博士研究生(导师:高光来教授)。