10.3969/j.issn.1008-0821.2018.04.016
利用词嵌入模型实现基于网站访问日志的专利聚类研究
[目的/意义]专利信息是人类科学技术进步的结晶,随着社会的发展,专利信息将为促进科技创新发挥日益重要的作用.利用聚类技术可以将海量专利信息进行自动分类,在实现信息有序归并管理的同时,有助于用户高效而全面的获取相关技术领域中的集成专利信息,具有重要的现实意义,传统聚类研究方法效率与准确度存在不足.[方法/过程]本文通过对专利信息服务网站(中国科学院知识产权网)访问日志数据的清洗与分析,生成专利信息点击序列,基于深度学习词嵌入模型,设计了PatentFreq2Vec模型,计算得出专利关联信息.[结果/结论]利用 PatentFreq2Vec模型分析计算访问日志数据,能够得到关联专利信息,实现专利聚类,且聚类准确度高于传统方法.
专利、聚类、深度学习、词嵌入、访问日志
38
G202(信息与传播理论)
中国科学院文献情报能力建设专项项目"情报计算分析框架体系建设"P21760
2018-05-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
112-117