基于有效词频的改进C-value自动术语抽取方法
现有的中文术语自动抽取方法主要针对术语的高频特征与单元性指标,而低频术语和术语的术语性指标缺乏有效的处理方法.针对上述问题,将背景语料库引入C-value方法,提出词语领域分布度与有效词频的概念,通过计算候选术语的EC-value值来自动抽取术语,并结合术语簇识别与挖掘,改善低频术语抽取性能.通过计算机领域术语抽取实验,表明本文提出的改进方法(EC-value方法)能更有效地衡量术语的术语性,改善低频术语抽取性能.
自动术语抽取、EC-value、有效词频、术语簇
TP391.1(计算技术、计算机技术)
国家自然科学基金项目"论证体篇章'结构与语义'协同交叉分析模型与算法研究"61240036;教育部人文社会科学基金项目"论证体篇章'结构与语义'协同分析方法研究"11YJC740157;江西省自然科学基金项目"面向语义理解的网页文本'结构与语义'协同交叉分析模型研究"项目20114BAB201027的研究成果之一
2013-10-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
54-59