古籍全文文本化中存在的若干问题
随着多媒体硬件技术和计算机软件技术的迅速发展,古籍全文数字化从20世纪80年代开始就逐渐成为研究的热点,并且取得了很多不错的成绩.然而,目前古籍全文数字化多采用全文图像化的方式,这种方式与全文文本化方式相比不利于古籍的全文检索.文章在搜集整理当前研究与应用成果的基础上,对古籍全文文本化涉及到的系统设计、古籍的种类、古籍图像的获取、古籍图像的自动版面分析、古籍图像中文字的自动分割与识别等几个方面存在的若干问题进行了探讨.
古籍数字化、全文文本化、版面分析、文字分割、字符识别
教育部人文社会科学研究青年基金项目12YJC870008;江苏省教育厅高校哲学社会科学基金项目2013SJB870004;国家自然科学基金项目61302157;江苏省社科研究文化精品课题12SWC-030;南京林业大学校级科技创新项目163080080;南京邮电大学引进人才启动基金项目项目NY210078等项目的系列研究成果之一
2013-12-03(万方平台首次上网日期,不代表论文的发表时间)
共6页
31-36