10.3772/j.issn.1673-2286.2019.11.008
面向图书采选的语义化查重策略
现有图书馆采选查重系统只能实现对书号、题名的重复检查,但图书出版同质化日益严重,针对异号相似图书查重困难的问题,构建基于自然语言处理技术的查重策略.首先选择主题词、内容提要和目录作为图书内容特征的指标进行建模,利用Word2Vec和WMD技术实现不同长度特征文本语义化相似度计算;然后,采用AHP方法计算特征相似度的权系数,得到图书相似度的综合评价指标;最后以西南大学图书馆数据为实验对象,验证查重策略的可行性.
采选查重、文本相似度、语义分析、评价指标体系
G25(图书馆学、图书馆事业)
本研究得到重庆市教育科学"十三五"规划2019年度规划课题"面向碎片化学习的生态型智慧教学平台构建研究"编号:2019-GX-306
2020-01-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
61-66