基于文本复杂网络的内容结构特征分析
针对文本信息内容结构参差不齐的问题,提出一种评价文本内容结构分析方法,该方法将文本中的句子作为节点,句子之间的共同名词作为边,构建文本复杂网络,并选取复杂网络的拓扑性质对文本结构特征进行分析.基于一个新闻文本案例构建复杂网络,并计算度、强度、最短路径、加权聚类系数等衡量指标,这些指标能很好地评价文本内容结构的好坏,也为理解和提取文本的中心思想、生成摘要、文本检索过滤提供重要参考依据.
文本复杂网络、内容结构、最短路径、聚类系数
G203(信息与传播理论)
教育部人文社会科学研究一般项目规划基金项目10YJA630001
2011-05-04(万方平台首次上网日期,不代表论文的发表时间)
69-73