一种基于多帧视频的文本图像质量增强方法
视频文本和视频内容高度相关,提供了理解视频内容的有用信息,然而文本往往位于复杂背景之中.从视频帧中定位到文本区域后,如果将其直接送人OCR软件,其识别效果较差.视频文本的时域信息提供了增强文本,消除背景的有用信息.因此,提出了一种利用视频文本的时域信息来消除背景,增强文本的方法.该方法首先利用边缘算子计算文本的轮廓特征,然后采用基于Hausdorff距离度量的匹配方法跟踪本文区域在相邻帧序列中的位置,利用多帧平均或帧间最小搜索法消去背景;其次,利用双线性插值技术调整文本尺寸,最终得到具有干净背景、合理分辨率的文本图像.不同测试视频序列的实验结果表明,该方法可以有效提高视频文本的OCR软件识别率.
视频分析、文本追踪、文本增强、Hausdorff距离
13
TP391(计算技术、计算机技术)
航空支撑科技基金项目05E551010
2008-11-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
1667-1672