10.3969/j.issn.1002-1965.2011.03.036
专利文献OCR校对方法研究
专利文献代码化对于专利无纸化审查、专利分析、专利检索和专利管理都非常重要.本文提出一种以专利文献OCR校对词典和技术领域特征为基础,利用中文分词、隐马尔科夫模型为方法的专利文献OCR校对框架和专利文献OCR中文文本的拼写校对方法,降低了人力成本投入,提高了专利文献代码化效率和代码化质量.本文最后给出了实验系统和实现结果.
OcR校时、专利文献、HMM模型、校时词其
30
H087(应用语言学)
2011-06-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
182-184,190