融合扩展信息瓶颈理论的话题关联检测方法研究
话题关联检测的关键任务在于判断给定报道对是否属于同一话题。现有判断方法往往忽略种子事件与其直接相关事件之间的层次关系。为此,通过分析报道内部语义分布规律及篇章结构,并依据语义分布规则,利用语义分布规律改进信息瓶颈(Information bottleneck, IB)算法,用于子话题逻辑语义单元的划分,并利用这些逻辑语义单元表示报道,进行话题关联检测。实验证明该方法有较快的收敛速度,并在一定程度上提高了系统性能。
关联检测、逻辑语义单元、信息瓶颈、单元特征
TP3;F27
国家自然科学基金60873247;山东省自然基金ZR2012FM038;山东省科技发展计划2012GGB01194资助Supported by National Natural Science Foundation of China60873247;Natural Foundation of Shandong ProvinceZR2012FM038;Science and Technology Development Plan of Shandong Province2012GGB01194
2014-04-03(万方平台首次上网日期,不代表论文的发表时间)
共9页
471-479