微博城市投诉文本中地理位置实体的完整性研究
[目的]利用互动问答社区——百度知道的知识共享、更新及时的优势,弥补维护大规模地理隶属关系资源库开销大的不足,并通过百度知道自动补全缺陷地理位置实体.[方法]对缺陷地理位置实体转化为所属区域问题,并通过百度知道进行检索;根据检索结果提取特征,计算该地理位置实体属于各个区域的得分,并构建缺陷地理位置实体的所属区域特征向量;利用规则对缺陷地理位置实体进行完整化处理,实现地理位置实体完整性表示.[结果]在完整化微博城市投诉文本中的缺陷地理位置实体时,该方法的综合精确率达到92.51%.[局限]对零地理位置实体无法完整表示.[结论]该方法对缺陷地理位置实体完整化是有效的、可行的.
微博城市投诉文本、缺陷地理位置实体、互动问答社区、特征值计算、完整性表示
TP391.1;G35(计算技术、计算机技术)
本文系2013年北京市属高等学校创新团队建设与教师职业发展计划项目"大数据内容理解的理论基础及智能化处理技术"项目编号:IDHT20130519、北京市科学技术研究院创新工程项目"面向智慧城市的公共设施协同管理关键技术研究"项目编号:PXM2014_17825_000002和网络文化与数字传播北京市重点实验室开放课题"基于棋局大数据的处理及计算机博弈关键技术研究"项目编号:ICDD201507的研究成果之一.
2016-05-23(万方平台首次上网日期,不代表论文的发表时间)
58-66