10.3969/j.issn.1002-1965.2011.11.031
中文专利权利要求书分词算法研究
中文专利权利要求书是一种半结构化的文本,应对各种检索需要,迫切需要将中文专利权利要求进行分词处理.本文在总结中文专利权利要求书的特点的基础上,提出了一种基于领域词典和规则相结合的面向中文专利权利要求书的中文分词模型,并对词典、规则的构建进行了说明.该方法在封闭式测试条件下取得了较好的分词结果,能够将文本分割为有意义的实体,并且对未登录词的识别效果较好.
中文分词、领域词典、中文权利要求书
30
TP391(计算技术、计算机技术)
北京自然科学基金"知识产权预警机制信息服务平台研究"9092002;北京教委科技项目"基于MAS的专利预警系统关键技术研究"KM200910005027
2012-03-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
152-155