近日,我院蒙古文信息处理技术重点实验室的学术论文 “A LSTM Approach with Sub-word Embeddings for Mongolian Phrase Break Prediction” 被国际著名学术会议27th International Conference on Computational Linguistics(COLING 2018)录用。该会议为计算语言学顶级会议,被中国计算机学会(CCF)推荐为“人工智能”方向的B类国际学术会议。
该论文深入研究了传统蒙古语语音合成中的韵律预测问题。在语音合成研究中,韵律的自动预测是提高合成语音自然度的重中之重。该论文在蒙古语语音合成资源有限的情况下,结合蒙古语的形态学特征,通过转换韵律建模粒度,将传统的韵律建模单元巧妙地转换为词干后缀,并利用子词词向量模型从有限的蒙古语语音合成文本语料中自动学习词干后缀的嵌入式表示,最终通过长短时记忆循环神经网络对词干后缀的韵律标记进行预测,显著提高了蒙古语韵律预测的准确率、召回率和F值。该论文作者为:刘瑞(博士生,导师为高光来教授),飞龙副教授(通信作者),高光来教授,张晖,王勇和。