我院张学良教授团队联合大象声科有限公司参加由昆山杜克大学、新加坡国立大学、美国南加州大学与AISHELL合作举办的INTERSPEECH 2020 (Conference of the International Speech Communication Association) 远场声纹挑战赛 (Far-Field Speaker Verification Challenge) 的文本相关多麦克风阵列任务中,排名国际第三。相关文章被interspeech 2020接收。作者分别为我院研究生张鹏,大象声科胡鹏和张学良。
INTERSPEECH 2020 远场声纹挑战赛着眼于智能家居实际场景,从多阵列多通道、远场带噪、手机注册远场测试、文本相关及文本无关等多种实际挑战出发,以推动声纹技术发展,衡量最新技术发展状况,找到最有前途的算法方法为目标, 为国际参赛研究机构提供了公平的统一评测平台和国内外学术交流平台。参加本次比赛的研究机构还有:华为、腾讯IBG、西北工业大学、蚂蚁金服、京东、STC-Innovations、中科院等国内外多家知名企业和高校。
内蒙古大学的参赛队伍,利用多种端到端深度学习方法来建模说话人的声纹信息,探索优化并提出了基于深度表示学习的说话人建模框架,在最终提交的测试结果上,在多麦的文本相关任务中取得第三名的成绩。
此外,张鹏同学今日还参加了2020年未来杯高校AI挑战赛,在语音赛道跨设备说话人识别比赛中取得了全国第一名的成绩。参加此次比赛语音赛道的高校还有:德克萨斯大学达拉斯分校,东京大学,广州大学,大连理工大学,重庆邮电大学等。