10.13833/j.issn.1007-7634.2022.10.001
基于词共现与词向量的概念层次关系自动抽取模型——以学术论文评价领域为例
[目的/意义]通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分,为后续领域本体的精细化构建提供参考.[方法/过程]首先,在由复合术语和关键词组成的术语集上,通过词频、篇章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层次体系.[结果/结论]经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理.[创新/局限]本文提出了 一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标签确定的方法比较简单,可以进一步探究.
自动抽取、本体构建、层次关系、语义相似度、词共现
40
G254(图书馆学、图书馆事业)
国家社会科学基金19ZDA349
2023-03-17(万方平台首次上网日期,不代表论文的发表时间)
共10页
3-11,32