10.3321/j.issn:1000-436x.2007.12.024
网络热点信息发现研究
为了有效挖掘海量网络数据中的热点信息,设计了网络热点信息发现算法.基于多级滤噪进行切分词拼接,利用特定的噪声库与多级滤噪策略严格控制拼接过程,挑选合理的收录策略,提取出能够准确反映海量网络数据中热门事件的热点信息串.在TDT国际标准评测语料上算法表现出令人满意的性能.
热点信息发现、未登录词识别、切分词拼接
28
TP391(计算技术、计算机技术)
国家重点基础研究发展计划973计划2004CB318109
2008-04-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
141-146