10.3969/j.issn.1002-1965.2011.10.031
基于目录的中文电子图书检索研究
以PDF格式的电子图书为研究实例,首先对PDF图书的结构进行解析,根据不同的解析结果,采用不同的策略对其实现目录范围的匹配检索.主要针对解析后的图片流,引入改型的Adaboost算法,对图片中的内容进行汉字识别,然后检索匹配,这是本文提出的基于图书目录范围的电子图书检索方式,并构建了基于目录的电子图书检索系统.
目录、电子图书检索、PDF解析、Adaboost算法
30
TP399(计算技术、计算机技术)
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
163-167,188