10.11896/j.issn.1002-137X.2016.3.043
位置信息记录中基于期望最大化的名称消重算法
在包含位置信息的签到记录中,每条记录仅包含名称和位置(经纬度)两个属性.传统的名称消重算法通过匹配实体的属性值或者计算实体间的名称相似性进行消重,忽略了位置信息的特殊性.为了提高位置信息记录中名称消重的质量,提出了一种基于期望最大化的位置名称消重算法.首先,提出了一种包含核心单词和背景单词的文本名称模型,并给出了计算模型参数值的期望最大化算法.其次,在文本名称模型中引入位置信息,将整个地图划分为若干个网格,分别计算每个网格中核心单词和背景单词的分布情况,并提出了一种考虑位置的文本名称模型.最后,将位置文本名称模型用于位置信息记录中的名称消重,并给出了相应的名称消重算法.实验表明,与传统的名称消重模型相比,提出的位置名称消重模型可以更好地识别出名称中包含的核心词汇,因而在名称消重时具有更好的性能.
签到、位置、期望最大化、名称消重
43
TP319(计算技术、计算机技术)
国家重大专项资助项目2008zx05026-001-09;国家自然科学基金项目6140060035;四川省教育厅自然科学一般项目16ZB0074
2016-04-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
238-241,251