10.3969/j.issn.1002-1965.2010.09.037
基于文献的中文命名实体识别算法适用性分析研究
命名实体识别(Named Entity Recognition)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等.首先对我国关于命名实体识别研究的文献进行了总结,给出命名实体识别的主要方法及模型.并针对文献中对这些命名实体识别方法的效果进行统计分析,探讨各种识别对象、识别模型的效果及适用性.经过对现有研究文献的统计,结论为:在不考虑运行效率的情况下,对于机构名,识别效果最好的是层叠CRF模型;对于地名,测试效果最好的是CRF方法与专家知识相结合;人名识别方法中表现不错的则是边界模版和局部统计相结合的模型.
中文命名实体识别、隐马尔可夫模型、最大熵模型、支持向量机、条件随机场
29
TP319(计算技术、计算机技术)
2010-11-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
157-161,169