10.13266/j.issn.0252-3116.2016.20.015
一种基于相似度的专利与产业类目映射模型——以《国际专利分类》与《国民经济行业分类》为例
[目的/意义]提出一种基于相似度的专利与产业类目映射模型,模型拥有准确、易扩展和高效率的优点,可为后续研究提供借鉴和参考.[方法/过程]整理现有专利与产业类目映射方法,以《国际专利分类》与《国民经济行业分类》为例,设计类目映射模型并做映射实验,通过Z-score标准化方法处理余弦相似度结果,完成《国际专利分类》小类与《国民经济行业分类》小类的部分映射,并根据国家知识产权局的试用版本对照成果综合评价本模型.[结果/结论]模型综合考虑专利官方注释规范精炼性和大量专利数据覆盖面广的优点,通过自然语言处理技术自动化得到专利与产业类目的映射组合,较现有方法在节省大量人力成本的同时保证了正确率,并可方便地进行映射类目细粒度的调整,适用于其他符合本模型数据格式要求的专利与产业分类的映射.
专利分类、产业分类、类目映射、映射方法
60
G254.11(图书馆学、图书馆事业)
2016-12-20(万方平台首次上网日期,不代表论文的发表时间)
123-131