10.13266/j.issn.0252-3116.2019.18.013
基于依存句法分析的中文专利候选术语选取研究
[目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性.[方法/过程]主要包括依存句法分析、剪枝、生成依存子树等三个主要步骤.首先对中文专利进行依存句法分析,得到依存树,对依存树进行剪枝,去除不符合要求的依存关系,生成依存子树,从中选取连续词串作为候选术语,以抽取中文专利术语.[结果/结论]实验结果表明,与已有的中文专利候选术语选取方法相比,本文提出的基于依存句法分析的中文候选术语选取方法能够有效地提高中文专利术语抽取的准确性.
术语抽取、依存句法分析、中文候选术语选取
63
G202(信息与传播理论)
本文系教育部人文社会科学规划项目 "大数据时代技能知识图谱构建研究";国家社会科学基金一般规划项目"大数据时代支持创新设计的多维度多层次专利文本挖掘研究"
2020-07-29(万方平台首次上网日期,不代表论文的发表时间)
共10页
109-118