10.3969/j.issn.1671-0673.2014.06.015
一种针对汉字特点的场景图像中文文本定位算法
针对场景图像中的中文文本定位问题,提出一种基于汉字特点的中文文本定位算法.算法首先对图像提取MSER(最大稳定极值区域),然后通过剪枝策略对存在嵌套关系的MSER进行取舍,得到候选笔画区域;计算候选区域的笔画宽度,作为闭操作的结构元参数并对图像进行动态闭操作,以消除同一汉字笔画之间的间隙,得到候选汉字区域;利用结构和角点规则过滤掉非汉字区域,并用颜色规则聚类得到候选文本区域;最后基于图像文本大都横向或纵向排列的规律,通过分析各组连通区的分布情况,对候选文本区域进行确定.在测试数据集上的实验表明,算法对于汉字与背景色差明显、汉字成行或成列排列等场景文本具有定位稳定性和准确性.
MSER、闭操作、文本定位、颜色聚类
15
TP391.4(计算技术、计算机技术)
国家自然科学基金资助项目61101112;河南省科技攻关基金资助项目122102210047
2015-02-02(万方平台首次上网日期,不代表论文的发表时间)
共8页
729-736