10.3772/j.issn.1002-0470.2008.12.008
基于启发式错误驱动学习的中文时间表达式识别
提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法.该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注,采用启发式A*算法搜索策略进行错误驱动学习,降低了规则学习的复杂度,并具有区分每条规则的有效性和规则间相容性的优点,使系统性能提高近6%.最终在封闭测试集和开放测试集上,F值分别达到了77.96%和77.92%.
时间表达式识别、时间触发词、依存分析、错误驱动学习、A*算法
18
TP3;H10
863计划2006AA0lZ145;国家自然科学基金60435020,60675034
2009-02-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
1258-1262