基于概念的文本结构分析方法
文本结构分析是文本处理领域中的重要内容,它可以有效地改进文本摘要、文本检索以及文本过滤的精度.文中简要描述了文本的物理结构和逻辑结构以及文本分析的背景,提出了文本结构分析中的层次分析方法. 该方法保证了层次划分的有序性,可操作性强,便于解释,不依赖于具体领域. 其基本思想是对于输入文本,首先识别出文本的物理结构;然后在概念映射、概念密度和概念消歧的基础上,将文本依据主题划分为若干层次;最终获得文本的逻辑结构.
向量空间模型、文本结构分析、文本层次分析、概念映射、概念密度、概念消歧
37
TP391(计算技术、计算机技术)
中国科学院资助项目69675019;高等学校博士学科点专项科研项目
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
324-328