10.3772/j.issn:1673-2286.2008.09.005
医学文献集合的主题抽取和主题聚类实践
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题"知识抽取"的文章之一.
知识抽取、主题抽取、BM25F、MMTx、文本挖掘、医学数据挖掘、数字图书馆
TP3(计算技术、计算机技术)
国家社会科学基金05BTQ006;国家科技支撑计划项目2006BAH03B05
2008-11-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
32-36