科技查新中检索词智能抽取系统的设计与实现
[目的]解决科技查新领域检索词选择时的主观性强、手工工作量大、不规范、费时费力的问题.[应用背景]为了实现检索词抽取过程的自动化、智能化、规范化,本文提出利用科技查新过程检出的实时相关语料作为领域知识的来源,并对语料组成类型与关键词抽取效果之间的关系进行讨论.[方法]通过关键词抽取、领域特征扩展相结合的递进式迭代抽取方式实现科技查新领域检索词的智能抽取.[结果]通过与实际查新案例所采用的检索词对比,发现使用本方法两次迭代后抽取10个检索词,召回率达到80%.[结论]基于查新过程中检出文献构成的动态相关语料进行检索词的迭代抽取有助于快速、准确锁定绝大部分检索词,提高检索的效率和效果.
科技查新、检索词、关键词抽取、网络爬虫
TP391(计算技术、计算机技术)
本文系国家自然科学基金项目“云计算环境下的隐蔽信道机理研究”项目编号:61170072、国家自然科学基金青年科学基金项目“移动智能终端隐蔽信道机理研究”项目编号:61303057和中国科学院、国家外国专家局创新团队国际合作项目“安全攸关软件理论和构造方法”的研究成果之一.
2017-01-17(万方平台首次上网日期,不代表论文的发表时间)
82-93