10.16337/j.1004-9037.2017.04.023
基于最大熵的越南语新闻事件元素抽取方法
越南与中国一水相依,是重要的政治、军事和经济合作邻国,然而针对越南语新闻事件元素的提取研究非常匮乏.本文针对越南语特点,提出一种基于最大熵模型的越南语新闻事件元素抽取方法.该方法针对越语句子结构和词汇语义的特点,采用最大熵算法,选取上下文、邻近触发词以及邻近实体作为特征,定义特征模版,训练获得越南语新闻事件模型,实现新闻事件元素抽取.抽取实验结果表明本文提出的方法抽取新闻事件元素的准确率达到80%以上.
越南语、最大熵、机器学习、新闻事件元素抽取
32
TP391.1(计算技术、计算机技术)
国家自然科学基金61462055,61562049
2017-11-01(万方平台首次上网日期,不代表论文的发表时间)
共6页
838-843