10.3969/j.issn.1007-2683.2014.05.023
一种基于连通域搜索的英文单词切分方法
英文文本识别系统中单词切分效果直接影响系统识别准确率.提出一种有效利用单词中的连通域以实现单词切分的方法,该方法首先对给定的图像文件进行扫描,搜索图像中所存在的所有连通域,然后根据连通域的坐标、尺寸等影响因素,对有效的连通域进行合并,并过滤掉噪声等因素所产生的连通域碎片,以实现有效的英文单词区域的正确分割,从而实现英文单词的正确切分.实验结果表明,针对相同的英文文本图像,该方法对英文单词切分的准确率达95%以上,与垂直投影切分法最高准确率27%相比有较大幅度的提高,证明该方法可以很好解决垂直投影法无法解决的字母之间相互交迭的单词切分问题.
连通域搜索、单词切分、文本识别
19
TP391(计算技术、计算机技术)
黑龙江省教育厅科学技术研究项目12541119
2014-12-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
109-112,119