10.3969/j.issn.1671-1815.2016.14.042
专利技术功效短语获取研究
在专利技术功效矩阵构建研究中,专利技术功效短语获取是矩阵构建的基础,也是构建矩阵的词汇来源。专利技术功效短语获取的准确性直接影响专利技术功效矩阵构建的效果。为了提高专利技术功效短语的准确性,基于汽车新能源专利文献文本数据基础上,综合考虑专利文献结构、专利文献线索词,以及专利文献的句法、语法分析等多种因素,提出了基于规则和统计相结合的专利技术功效短语获取方法。首先,根据专利摘要文本定位包含专利技术功效短语的单句,提取技术功效目标句;其次,在改进的分词方法和词性标注的基础上,针对包含功效短语的句子,结合依存关系规则、短语规则计算出共现频率较高的词,并提取技术功效短语。利用该方法获取专利技术功效短语,其准确率可到达85%。实验证明该方法在获取专利技术功效短语中是有效的、可行的,进而整体上提高专利技术功效短语的识别效果。
规则、依存关系、短语规则、技术功效短语
16
TP391.3(计算技术、计算机技术)
国家自然科学基金项目61271304;北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目KZ201311232037;北京市属高等学校创新团队建设与教师职业发展计划项目IDHT20130519;北京市科研院创新工程项目PXM2013_178215_000002
2016-06-20(万方平台首次上网日期,不代表论文的发表时间)
共8页
228-235