学术动态

当前位置: 首页 学术动态 正文
我院蒙古文智能信息处理团队在信号处理领域国际顶级期刊发表最新研究成果

发布日期:2020-11-30来源:


近日,我院计算机学院蒙古文智能信息处理团队与新加坡国立大学李海洲教授团队合作在国际信号处理领域TOP期刊《IEEE/ACM Transactions on Audio, Speech, and Language Processing》上发表了题为“Exploiting Morphological and Phonological Features to Improve Prosodic Phrasing for Mongolian Speech Synthesis”的研究论文(DOI:10.1109/TASLP.2020.3040523)。《IEEE/ACM Transactions on Audio, Speech, and Language Processing》期刊是音频、声学、语言信号处理的顶级期刊,是中科院SCI期刊分区为一区TOP期刊,清华大学最新版计算机学术推荐列表中认定的A类刊物,影响因子3.531。

该论文针对蒙古语语音合成的韵律建模问题开展研究,提出了一种融合形态学和音系学的蒙古文韵律建模方法。我校2020届博士毕业生 刘瑞 (指导教师:高光来教授)为该论文第一作者,计算机学院飞龙副教授为论文通讯作者,内蒙古大学为该论文第一作者和通讯作者单位。

韵律建模问题是影响语音合成自然度和可懂度的重要因素。随着深度学习技术的发展,在海量文本和语音数据的支撑下,韵律建模的效果可以取得令人满意的效果。但是,在面对蒙古语这样的低资源语言时,韵律建模往往充满很多挑战。第一,蒙古文韵律建模的数据规模有限,没有海量的文本和语音数据用于模型的充分训练;第二,蒙古文独特的黏着语特性导致蒙古文单词具有复杂的构词特点,现有韵律建模方法并没有充分挖掘与韵律表达相关的构词特点以用于蒙古文韵律模型的训练。为了解决以上问题,本文提出了一种蒙古文单词表示特征强化方法,并融合自注意力机制进行韵律标签的预测。本文利用了蒙古文单词的形态学构词知识和音系学构词知识来增强文本编码器的特征表达能力。考虑到自注意力模型可以充分学习输入文本的全局上下文相关性,本文将自注意力模型作为韵律模型的解码器进行韵律标签的预测。最后通过一系列的客观和主观实验验证了本文提出方法的有效性,实验结果证明本文提出的方法可以有效提升蒙古文韵律建模的精度,并且最终提升蒙古语语音合成系统合成语音的整体表现。

该研究得到了国家重点研发计划项目(2018YFE0122900)、国家自然基金项目(61773224,62066033),内蒙古自然科学基金项(2018MS06006),内蒙古自治区成果转化项目(CGZH2018125)、内蒙古自治区应用技术研究与开发资金项目(2019GG372,2020GG0046)等项目的资助。


   论文链接:https://ieeexplore.ieee.org/document/9271923


地址:内蒙古呼和浩特市大学西路235号内蒙古大学计算机学院

版权所有 © 内蒙古大学计算机学院

官方微信