互联网新闻报道中的突发事件识别研究
为及时、准确地捕获突发事件,提出词间距的思想,并构建基于互联网新闻报道的突发事件识别模型.该模型主要包括热点词元发现和新词语检测两部分,即通过改进的TF-PDF算法捕获当前关注的词元以形成热点词元,利用词间距来寻找热点词元之间的客观分布状态,从而依据热点词元之间相对稳定的组合达到突发事件识别的目的.实验表明该模型对突发事件的识别,在时间上有着较高的敏感性.
事件识别、热点词元、词间距
G354(情报学、情报工作)
上海市社会科学规划课题2009ETQ001;教育部人文社会科学研究项目09YJC860011
2011-08-09(万方平台首次上网日期,不代表论文的发表时间)
52-57