10.3772/j.issn.1000-0135.2014.01.003
科技论文关键词特征及其对共词分析的影响
针对传统共词分析中高频词共现矩阵的构建方法提出了一些疑问,包括:抽取高频词作为分析对象的可靠性、高频词矩阵对领域内重要共现关系的保留程度、关键词的语义类型特征和关键词缺失可能带来的影响.通过实证数据揭示了科技论文的关键词词频、共现关系、语义类型的分布特征,并分析了它们对共词分析方法的影响,包括:基于关键词的共词分析只能分析热门知识节点,共词网络实质上是建立在不稳定的单次关联基础之上,而高频词矩阵则会丢失大量重要的共现关系,这些问题是由关键词的语义类型特征决定的,该特征是实现词语间差异化乃至语义化处理的重要切入点.另外,本文在对比关键词增补前后的共词矩阵后发现,增补关键词实质上无法优化高频词矩阵对所分析…展开v
共词分析、关键词特征、词频分布、情报学
33
G25;TP3
国家自然科学基金资助项目"数字图书馆社区的知识聚合与服务研究"项目71273197的研究成果之一
2014-03-05(万方平台首次上网日期,不代表论文的发表时间)
共10页
23-32