10.3969/j.issn.1000-436x.2013.08.001
基于依存连接权VSM的子话题检测与跟踪方法
针对在新闻话题中报道突发、热点相似且子话题层次丰富的现象,依据增量 TF-IDF 值构造特征维,生成全局向量;然后在时间窗内生成特征连接权的局部邻接图,利用依存句法进行分析降维;最后采用领域词典加权,时间阈值衰减;从而构造出利用依存连接权VSM进行关联分析的子话题检测与跟踪(sTDT)计算方法。实验表明,利用依存关联分析使文本表示由线性变为平面结构,能够有效地提取描述子话题;在人工标注的测试语料下,其最小DET代价比经典方法至少降低2.2%。
话题检测与跟踪、依存连接权、关联词对、报道关系检测、向量空间模型
TP391(计算技术、计算机技术)
海军工程大学科学研究基金资助项目HGDYDJJ10008 Foundation Item:The National Natural Science Foundation of Naval University of Engineering HGDYDJJ10008
2013-09-13(万方平台首次上网日期,不代表论文的发表时间)
共9页
1-9