10.3778/j.issn.1002-8331.1902-0119
朝汉混排古籍的文字切分方法
为解决朝鲜语古籍数字化中朝汉文种混排字符切分困难的问题,提出一种朝鲜语古籍图像的文字切分算法.针对古籍列与列之间存在不连续间隔线、倾斜或者粘连等问题,提出一种基于连通域投影的列切分方法.利用连通域的删除、合并、拆分等操作对文字进行切分.使用一种多步切分法完成了具有文字大小不一,横向、纵向混合排版特点图像的字符切分工作.对于粘连字,采用改进的滴水算法进行有效切分.实验结果表明所提出的算法能够很好地完成朝、汉文种混排,文字大小不一,排版情况复杂的朝鲜语古籍图像的文字切分工作.该算法的列切分准确率为97.69%,字切分准确率为87.79%.
古籍数字化、朝鲜语古籍、列切分、字符切分
56
TP391.4(计算技术、计算机技术)
吉林省教育厅"十三五"科学技术项目;延边大学世界一流学科建设培育项目
2020-06-10(万方平台首次上网日期,不代表论文的发表时间)
共7页
135-141