站内搜索

  

友情链接

学术动态

我院张学良教授团队在声学回声消除领域取得新进展
来源:  发布时间: 2023-06-06 20:20:42

     

近日,我院张学良教授团队在国际信号处理领域顶级期刊《IEEE/ACM Transactions on Audio, Speech, and Language Processing》上发表了题为“Neural Multi-Channel and Multi-Microphone Acoustic Echo Cancellation”的学术论文(DOI:10.1109/TASLP.2023.3282103)。


近年来,深度学习技术已应用于多通道(MC)和多麦克风(MM)声学回声消除(AEC)任务中,由于不需要对扬声器信号进行去相关处理,从而取得了显著的性能提升。本文中,团队提出了一种基于深度学习的复数频谱映射框架,其中包括了原地卷积和频率时间建模,用于解决MCAECMMAEC问题。该框架能够有效地建模了回声路径和空间信息。所提出的方法是一种多输入多输出(MIMO)方案,可以同时一次性的从所有麦克风信号中滤除回声,从而大大减少了系统计算代价。团队还设计了一个跨域损失函数和多任务学习策略,以提高模型的泛化能力。在各种不匹配的场景下进行的实验表明,提出的方法明显优于先前的方法。此外,所提出模型的轻量级版本仅有0.29M可训练参数,并展示出良好的性能,这对于计算资源有限和实时需求的应用来说至关重要。



IEEE/ACM Transactions on Audio, Speech, and Language Processing》期刊是是音频、声学、语言信号处理的顶级期刊,在中科院SCI期刊小类学科(声学)分区为一区期刊,最新影响因子4.364。文章第一作者为我校计算机学院2018级博士生张成刚,张学良教授为论文通讯作者,内蒙古大学为该论文第一作者和通讯作者单位。张成刚于2022年底获得内蒙古大学博士学位,在学期间,共发表高水平论文4篇,包括IEEE/ACM TASLP 1篇,ICASSP 1篇,INTERSPEECH 2篇。担任INTERSPEECH 2023审稿人。张成刚博士目前在内蒙古民族大学任教。


论文链接:https://ieeexplore.ieee.org/document/10141581


地址:内蒙古呼和浩特市大学西路235号内蒙古大学计算机学院

版权所有 © 内蒙古大学计算机学院