关联数据在学术资源网相似文献发现中的应用研究

引用

摘要：

[目的]利用关联数据的机器可读、语义表示、关联描述和网络资源属性的优势,弥补学术资源网信息组织的不足,为相似文献发现提供支持.[方法]采用潜在语义分析方法计算学术资源网发布的文献的总体相似度,通过层次聚类方法确定相似度阈值进行相似度筛选,生成文档关系矩阵,在此基础上利用动态文档技术构造学术资源网关联数据以支持关联文献语义检索.[结果]初步实现具有相似文献查询功能的学术资源网关联数据,用于便捷地获得与任何一篇文献高度相关的文献,有助于高效地发现相似文献.[局限]仅从统计学角度实现学术资源网中相似文献的发现,对于利用文档集知识体系、语义内涵和组织方式等进行深度的相似文献发现有待进一步研究.[结论]潜在语义分析方法计算文献相似度可有效发现相似文档,将相似文献关联记录在关联数据中,支持语义检索获得精确的相似文献,并能够大幅缩减实时相似性计算的延迟.

关键词：关联数据、潜在语义分析、学术资源网、相似度

分类号：G354(情报学、情报工作)

资助基金：本文系国家自然科学基金项目"语义网络环境下数字图书馆资源多维度聚合与可视化展示研究"项目编号:71273111和吉林大学高峰学科群建设项目的研究成果之一.

在线出版日期：2016-05-23（万方平台首次上网日期，不代表论文的发表时间）

页码：41-49

英文信息展示

期刊专题