学术论文大纲中关键术语抽取方法研究
[目的]针对学术论文大纲内容精炼、层次性的特点,研究从中抽取重要且具有实质意义术语的方法.[方法]结合语言学规则和术语词典从大纲各级标题中识别出候选术语集,然后根据术语间的句法依存关系计算tf-idf,并利用大纲结构量化术语层级特征,最后结合tf-idf与层级特征对候选术语进行排名,选择出关键术语.[结果]实验证明,该方法的候选术语识别F值达到89.57%,术语选择F值达到36.89%.[局限]采用的术语抽取规则不完备,且tf-idf计算过程中的权值设置仅使用经验值,导致未能达到最优效果.[结论]该方法能有效抽取大纲中的关键术语,适用于层级结构中的关键术语抽取.
候选术语识别、候选术语选择、句法依存关系、层级特征
TP393(计算技术、计算机技术)
国家科技支撑计划子课题“基于文献知识网络的领域学术关系研究与示范”项目2011BAH10B06-04的研究成果之一
2014-04-30(万方平台首次上网日期,不代表论文的发表时间)
共7页
73-79