10.3969/j.issn.1002-7378.2004.04.026
海蓝目录自动识别系统的设计
设计海蓝目录自动识别系统.该系统在获取已预处理过的目录图像之后,对图像进行版面分析,利用OCR技术识别文字,并自适应地获取目录的缩进量作为判断目录层次的依据,最后通过目录提取和人工校正得到统一的目录格式.该系统具有自动识别、提取书籍目录结构等功能,能有效地处理多种格式的书籍目录类型.
目录识别、OCR、版面分析、缩进量、目录提取、人工校正
20
TP391(计算技术、计算机技术)
2005-02-22(万方平台首次上网日期,不代表论文的发表时间)
共3页
284-286