10.3321/j.issn:1003-9775.2002.01.005
连通区的页面分割与分类方法
页面分割与分类是文档处理的关键步骤,但目前多数方法对页面的块和倾斜进行了限制.文中提出一种新的基于连通区的页面分割与分类方法.首先采用快速算法抽取页面内的连通区,然后利用改进的RLSA算法分割页面,并根据连通区的分布情况以及块的特征对块进行分类.该方法将页面分割与分类紧密结合,充分考虑到块的局部特征,保证块分类的正确性,大大提高了算法效率.
文档处理、页面分割、页面分类、RLSA
14
TP391(计算技术、计算机技术)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
17-20,25