期刊专题

10.3778/j.issn.1002-8331.1902-0119

朝汉混排古籍的文字切分方法

引用
为解决朝鲜语古籍数字化中朝汉文种混排字符切分困难的问题,提出一种朝鲜语古籍图像的文字切分算法.针对古籍列与列之间存在不连续间隔线、倾斜或者粘连等问题,提出一种基于连通域投影的列切分方法.利用连通域的删除、合并、拆分等操作对文字进行切分.使用一种多步切分法完成了具有文字大小不一,横向、纵向混合排版特点图像的字符切分工作.对于粘连字,采用改进的滴水算法进行有效切分.实验结果表明所提出的算法能够很好地完成朝、汉文种混排,文字大小不一,排版情况复杂的朝鲜语古籍图像的文字切分工作.该算法的列切分准确率为97.69%,字切分准确率为87.79%.

古籍数字化、朝鲜语古籍、列切分、字符切分

56

TP391.4(计算技术、计算机技术)

吉林省教育厅"十三五"科学技术项目;延边大学世界一流学科建设培育项目

2020-06-10(万方平台首次上网日期,不代表论文的发表时间)

共7页

135-141

暂无封面信息
查看本期封面目录

计算机工程与应用

1002-8331

11-2127/TP

56

2020,56(11)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn