10.3969/j.issn.1002-137X.2013.06.042
中文微博命名实体识别
微博这一媒体形式的迅速发展为命名实体识别提供了一个新的载体.根据微博文本的特点,提出针对中文微博的命名实体识别方法.首先,对微博文本做规范化处理,消除由于微博表达不规范造成的干扰;在建立中文人名库、常用地点库等知识库的基础上,选取适合微博的特征模板,使用条件随机场方法进行实体识别;同时,将正确的识别结果添加到知识库中以提升识别效果.在真实微博数据上的实验表明,该方法能够有效地完成中文微博的命名实体识别任务.
中文信息处理、微博、命名实体、条件随机场
40
TP391(计算技术、计算机技术)
国家自然科学基金项目60970061,61075056,61103067;中央高校基本科研业务费专项资金资助项目资助
2013-07-10(万方平台首次上网日期,不代表论文的发表时间)
共3页
196-198