10.3969/j.issn.1002-1965.2023.03.017
子话题及词汇关联视角下的新兴领域热点主题演化研究
[研究目的]新兴领域由于发展时间不长,相关研究的文本量不够充足,先切分文本后关联主题的演化方法可能会导致各时间窗主题重复等问题,因此提出一种先整体识别热点,后切片分析演化的方法,解决新兴领域演化分析中文本量不足的问题.[研究方法]以制氢领域的核心中文期刊文献为数据源,通过构建指标体系先对整体语料库进行热点主题识别,再进行时间切片.对每个时间窗口的文本进行LDA主题抽取,并利用Word2Vec训练词向量,通过相似度计算进行热点主题的子话题关联及其主路径的词汇关联,从而分析各热点主题的结构演化和内容演化.[研究结论]绘制了各热点主题的结构演化图,并以热点主题光催化剂性能及其制备为例,揭示了其在各时间窗内的热点转移关系;同时绘制了其内容演化图,揭示了其各时间窗内的研究重点.实现了演化研究方面的精细化表达,为文本量不够充足的新兴领域演化分析提供了有效可行的思路.
新兴领域、热点主题、相似度计算、切片演化、制氢、词汇关联
42
G353(情报学、情报工作)
山西省社会科学院山西省人民政府发展研究中心项目;山西省社会科学院山西人民政府发展中心项目;校级教改项目
2023-03-27(万方平台首次上网日期,不代表论文的发表时间)
共7页
123-129