期刊专题

10.13266/j.issn.0252-3116.2022.06.013

基于决策树的多源文献元数据融合研究

引用
[目的/意义]构建多源文献元数据融合模型,有助于提升文献元数据整体质量,促进资源发现系统中的元数据管理与利用,优化用户资源发现服务体验.针对笔者此前提出的文献元数据判重策略进行优化,从经验为主向自动化转变,在保障判重和融合效果的前提下,提升整个过程的自动化水平.[方法/过程]针对不同类型文献的元数据项不一样、同一文献不同来源的元数据项不一样均会使得判重方法有所区别的情况,提出一种自动化的基于决策树的多源文献元数据融合模型,将判重问题转化为分类问题,根据特征相似度选择特征并构造决策树,在此基础上实施元数据判重及融合,并以不同类型的文献资源元数据为例进行实验,对策略进行效果验证.[结果/结论]结果显示,对于5种文献类型元数据,判重策略的准确率均达到99%以上,召回率均达到98%以上,总体效果较好.对于融合策略的效果判断,专利、学位论文、期刊论文、会议论文、图书的元数据项质量提升比例分别为15.15%、36.80%、15.29%、52.63%、15.38%,均有明显幅度的提升.

多源元数据、决策树、元数据判重、元数据融合

66

G254(图书馆学、图书馆事业)

国家社会科学基金16BTQ063

2022-04-20(万方平台首次上网日期,不代表论文的发表时间)

共8页

118-125

相关文献
评论
暂无封面信息
查看本期封面目录

图书情报工作

0252-3116

11-1541/G2

66

2022,66(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn