面向领域科技文献的句子级创新点抽取研究
[目的]抽取领域科技文献中句子级创新点.[方法]面向文献中的句子,以领域词表和本体中的关系为基础构建识别规则,采用基于主题词重叠度的冗余度计算方法过滤创新点候选集.[结果]选取肿瘤领域的数据集进行实验,抽取结果的准确率为89.42%,召回率为60.14%.[局限]规则有待进一步完善,提高召回率.[结论]利用领域词表和本体中的关系能有效地抽取科技文献中的句子级创新点.
科技文献、语言学特征、结构式摘要、创新点抽取、冗余度计算
TP393(计算技术、计算机技术)
本文系国家科技支撑计划子课题“基于文献知识网络的领域学术关系研究与示范”项目编号:2011BAH10B06-04的研究成果之一.
2014-10-16(万方平台首次上网日期,不代表论文的发表时间)
15-21