DOI：10.13266/j.issn.0252-3116.2019.18.013

基于依存句法分析的中文专利候选术语选取研究

引用

摘要：

[目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性.[方法/过程]主要包括依存句法分析、剪枝、生成依存子树等三个主要步骤.首先对中文专利进行依存句法分析,得到依存树,对依存树进行剪枝,去除不符合要求的依存关系,生成依存子树,从中选取连续词串作为候选术语,以抽取中文专利术语.[结果/结论]实验结果表明,与已有的中文专利候选术语选取方法相比,本文提出的基于依存句法分析的中文候选术语选取方法能够有效地提高中文专利术语抽取的准确性.

关键词：术语抽取、依存句法分析、中文候选术语选取

所属期刊栏目：63

分类号：G202(信息与传播理论)

资助基金：本文系教育部人文社会科学规划项目 "大数据时代技能知识图谱构建研究";国家社会科学基金一般规划项目"大数据时代支持创新设计的多维度多层次专利文本挖掘研究"

在线出版日期：2020-07-29（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：109-118

英文信息展示

期刊专题