10.3969/j.issn.1006-2475.2013.03.015
基于新闻标题的网络热词发现算法
使用基于PAT-Tree的候选短语提取算法,通过修改PAT-Tree数据结构使之适合处理变长中文字符串及非中文字符.根据交互信息评估字符串的关联程度,并结合新闻报道和网络热词的特点提出向前过滤算法发现网络热词.与其它同类算法相比,本算法不需要制定复杂的语言规则和候选短语的评分公式,实现更加简单、速度更快.实验证明了本文算法的有效性和正确性.
网络热词、PAT-Tree、互信息、中文字符串、候选短语
TP311(计算技术、计算机技术)
2013-05-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
58-62,66