10.11925/infotech.2096-3467.2020.0577
融入术语与层级信息的专利关键短语抽取方法研究
[目的]针对图模型方法在专利关键短语抽取过程中偏向于选取长关键短语并忽略短语所在位置的问题,提出融入术语度与层级信息的专利关键短语抽取方法,提高专利关键短语抽取的准确性.[方法]基于传统的图模型方法,提出一种新的术语度指标,以衡量候选关键短语的术语信息;根据专利文献特征,将专利划分为若干层级,提出层级权重指标,以度量候选关键短语位置信息.[结果]融入术语信息,专利关键短语抽取方法F值相对提高7.615%(纳米)、11.515%(图像识别)、9.813%(芯片)和8.839%(液晶显示).融入层级信息,专利关键短语抽取方法F值相对提高9.880%(纳米)、6.929%(图像识别)、6.099%(芯片)和5.576%(液晶显示).[局限]基于词性规则的候选关键短语选取方法会产生较多的噪声.[结论]利用术语度与层次信息的专利关键短语抽取方法能够有效提高专利关键短语抽取的准确性.
专利、关键短语抽取、术语、层级
7
G202(信息与传播理论)
2023-09-07(万方平台首次上网日期,不代表论文的发表时间)
共14页
99-112