期刊专题

文献关键词链接标引方法研究

引用
[目的]以本体管理与服务平台为基础,利用三元组获取和自然语言处理技术实现中文科技文献的自动标引.[方法]通过Web Services接口将本体知识库和词汇资源集成到标注模块中,利用词典匹配和分词组合方法分别获取文献中的领域词和未登录词,并与本体知识库中的三元组建立链接,形成领域概念关系网络.[结果]通过语料测试,系统能以86篇/秒的较快速度进行文献标引和词汇链接,并达到65%的全面率和69%的准确率.[局限]词典加载后未做索引,匹配计算耗时过多,空格、断行等噪声数据对文本的分词处理和词性判断产生影响.[结论]数据清洗流程和关键词筛选算法改善后,可以进一步提高标引效率,为深度挖掘文本提供支撑.

Web服务、文本标注、关键词标引、三元组链接

TP391.1(计算技术、计算机技术)

本文系中国科学技术信息研究所重点工作项目“结构化知识服务平台建设及应用”项目编号:ZD2015-2和国家自然科学基金项目“面向特定情报分析应用的知识组织系统快速构建关键问题研究”项目编号:71203208的研究成果之一.

2015-10-23(万方平台首次上网日期,不代表论文的发表时间)

31-37

暂无封面信息
查看本期封面目录

现代图书情报技术

1003-3513

11-2856/G2

2015,(9)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn