10.11959/j.issn.2096-0271.2016022
基于短文本的食源性疾病事件探测技术
微博数据是短文本事件探测的典型数据源,由于微博内容的多样性、稀疏性和碎片性,现有事件探测方法使用的数据源单一且噪声较大,在时空信息的发现上粒度过大,导致结果的准确性差.因此,在事件探测算法上提出动态上下文窗口算法,构建候选微博进行事件探测,提高了事件探测的效率和精度.并提出利用微博内容发现特定事件地理位置信息的算法,提高了事件时空信息的获取精度.最后应用于食源性疾病事件的自动探测中,相比以往的事件探测方法,扩大了数据来源,且时间和空间维度上的准确性得到显著提高.
短文本、事件探测、时空信息、微博、食源性疾病
2
TP399(计算技术、计算机技术)
国家自然科学基金资助项目No.91224006;国家“十二五”科技支撑计划资助项目No.2013BAD15B02;中国科学院战略性先导专项资助项目No.XDA06010307;国家卫生和计划生育委员会行业专项资助项目No.201302005
2016-04-27(万方平台首次上网日期,不代表论文的发表时间)
88-99