基于颜色聚类和多帧融合的视频文字识别方法

引用

摘要：

提出一种基于颜色聚类和多帧融合的视频文字识别方法,首先,在视频文字检测模块,综合考虑了文字区域的两个显著特征:一致的颜色和密集的边缘,利用近邻传播聚类算法,根据图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到若干边缘子图中去,使得在各个子图中检测文字区域更为准确.其次,在视频文字增强模块,基于文字笔画强度图过滤掉模糊的文字区域,并综合平均融合和最小值融合的优点,对在不同视频帧中检测到的、包含相同内容的文字区域进行融合,能够得到背景更为平滑、笔画更为清晰的文字区域图像.最后,在视频文字提取模块,通过自适应地选取具有较高文字对比度的颜色分量进行二值化,能够取得比现有方法更好的二值化结果:另一方面,基于图像中背景与文字的颜色差异,利用颜色聚类的方法去除噪声,能够有效地提高文字识别率.实验结果表明,该方法能够比现有方法取得更好的文字识别结果.

关键词：视频文字识别、基于颜色的聚类、多帧融合、视频检索、噪声去除

所属期刊栏目：22

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金60873154,61073084;国家发改委资助项目[2010]3044

在线出版日期：2012-03-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共15页

页码：2919-2933

英文信息展示

期刊专题