10.3969/j.issn.1000-0135.2009.01.013
基于CRFs的角色标注人名识别模型在网络舆情分析中的应用
本文在理论分析CRFs优于HMM和MEM等序列标注模型的基础上,提出一种基于CRFs的字角色标注人名识别模型.重点阐述了该模型的构建过程,包括角色定义、特征模板建立、特征函数生成及其参数训练、角色标注和基于模式的人名抽取等步骤,并通过实验验证模型的识别效果,探讨包括特征组合、字长窗口等在内的各种影响因素,探索模型的最佳识别条件,同时对CRFs和HMM在人名识别实验中进行了比较分析,认为CRFs在付出更大的实验复杂度的代价下,其人名识别效果明显优于HMM.论文最后通过实例探讨了CRFs-RL-PnR模型在网络舆情分析,包括新闻人物自动抽取、焦点人物时序分析等中的实践应用.
条件随机场、字角色、特征模板、模式匹配、网络舆情分析
28
TP3;H13
国家自然科学基金项目"电子政务中信息资源管理对政府辅助决策的研究"70373028
2009-02-24(万方平台首次上网日期,不代表论文的发表时间)
共9页
88-96