《Pattern Recognition》是模式识别和计算机视觉领域的国际著名期刊,属于中科院SCI一区TOP期刊,也是中国计算机学会CCF推荐B类期刊,2023年影响因子为7.5,主要发表关于计算机与信息科学领域有关模式识别的前沿研究成果。
Fine-grained Automatic Augmentation for Handwritten Character Recognition
作者:陈伟,苏向东,侯宏旭
单位:内蒙古大学
简介:手写文本识别旨在将各种复杂手写文本快速、准确地转换为可编辑和搜索的文本信息,以便于存储、检索和共享。由于该领域的识别模型的性能受限于低资源的手写训练样本,研究者们往往采用数据增广方法来增加样本规模以提高模型的性能。然而,现有的手写文本增广方法存在两个局限性:一是基于全局空间变换的方法通常将每个单词样本作为一个整体进行变换来增广训练数据,但忽略了从局部单词区域生成细粒度变换的潜力,限制了生成样本的多样性;二是当将这些方法应用于不同语言的数据集时,自适应选择合理的增广参数具有挑战性。
为了解决这些问题,该工作提出了用于手写体字符识别的细粒度自动增广框架。该框架将每个单词样本视为由多个笔画组成,并通过对笔画执行细粒度转换来实现数据增广。每个单词被自动分割成不同的笔画,每个笔画都用一个贝塞尔曲线拟合。在此基础上,我们定义了与细粒度变换相关的增广策略,并使用贝叶斯优化来自动选择最优的增广策略,从而实现了手写样本的自动增广。在7种不同语言的手写数据集上的实验表明,该框架对比基线对手写字符识别具有最佳的增广效果。
图1手写体字符识别的细粒度自动增广框架图