一种基于多帧视频的文本图像质量增强方法

引用

摘要：

视频文本和视频内容高度相关,提供了理解视频内容的有用信息,然而文本往往位于复杂背景之中.从视频帧中定位到文本区域后,如果将其直接送人OCR软件,其识别效果较差.视频文本的时域信息提供了增强文本,消除背景的有用信息.因此,提出了一种利用视频文本的时域信息来消除背景,增强文本的方法.该方法首先利用边缘算子计算文本的轮廓特征,然后采用基于Hausdorff距离度量的匹配方法跟踪本文区域在相邻帧序列中的位置,利用多帧平均或帧间最小搜索法消去背景;其次,利用双线性插值技术调整文本尺寸,最终得到具有干净背景、合理分辨率的文本图像.不同测试视频序列的实验结果表明,该方法可以有效提高视频文本的OCR软件识别率.

关键词：视频分析、文本追踪、文本增强、Hausdorff距离

所属期刊栏目：13

分类号：TP391(计算技术、计算机技术)

资助基金：航空支撑科技基金项目05E551010

在线出版日期：2008-11-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：1667-1672

英文信息展示

期刊专题