10.3772/j.issn.1000-0135.2011.03.007
基于多层术语度的一体化术语抽取研究
以往的术语抽取研究大多将语言学方法和统计方法分别进行单独的处理,并且只考虑候选术语本身的术语度,而没有考虑候选术语所在句子的术语度对术语抽取性能的影响.本文将语言学方法与统计方法进行并行融合,综合考虑候选术语及其所在语句的术语度,进行基于多层术语度的一体化术语抽取.该研究有两个特色:首先,采用条件随机场模型,能有效融合语言学方法和统计方法,实验结果表明了基于一体化策略的术语抽取方法的有效性;其次,通过语料库比较方法,提出基于多层术语度的术语抽取方法,该方法能抽取多字术语,实验结果表明了利用多层术语度进行术语抽取的有效性.
术语抽取、多层术语度、一体化策略、条件随机场
28
TP3;H12
国家自然科学基金项目70903032;教育部人文社会科学研究一般项目08JC870007;"十一五"冶国家科技支撑计划重点项目2006BAH03B02
2011-03-28(万方平台首次上网日期,不代表论文的发表时间)
共11页
275-285