10.11925/infotech.2096-3467.2017.1091
科技论文中数值指标实际取值识别
[目的]科技论文中数值指标的大小有多种描述形式,本文旨在从不同形式的描述句中准确识别数值指标的实际取值.[方法]分析数值指标句中指标实体与数字实体间最小句法树路径,采用远程监督学习数值指标句的句法特征及描述特征,从领域候选句中识别数值指标句;利用少量语义标注数据学习“大于”、“小于”、“等于”、“倍数”4类取值关系模板,通过模板识别数值指标句的取值关系类别,依据不同取值关系模板对应的数值指标实际取值换算关系计算指标实际数值的大小.[结果]在气候变化领域和天文学领域开展实验,F值分别达到82.35%和77.55%,识别效果达到同类研究平均水平之上.[局限]以单句为数据单元开展识别研究,对于跨句间的指标取值问题未做考虑.[结论]本方法能够有效识别单句中数值指标的实际取值,识别过程不需要大量人工标注语料,迁移到其他领域时不做额外处理,系统性能不会明显下降,具有一定的实用性.
数值指标、实际取值、模板发现、远程监督
2
G250.76(图书馆学、图书馆事业)
2018-03-29(万方平台首次上网日期,不代表论文的发表时间)
共8页
21-28