DOI：10.11925/infotech.2096-3467.2020.0272

基于表示学习的无监督跨语言专利推荐研究

引用

摘要：

[目的]减少双语词典和大规模双语语料库的构建,提高专利文本语义的揭示和利用,从文本语义表示角度设计无监督的跨语言专利推荐方法,提高跨语言专利推荐效果和领域适用能力.[方法]首先设计无监督跨语言词向量映射方法,通过线性变换将独立的中英专利词向量映射到统一语义向量空间,构建中英词语间的语义映射关系;然后利用平滑倒词频的词向量加权方法,形成基于跨语言专利词向量的专利文本语义表示方法,实现中英专利文本在同一向量空间中的语义表示;最后应用向量相似度计算指标,计算不同语言专利文本间的语义相似度,构建基于表示学习的无监督跨语言专利推荐方法,实现跨语言专利推荐.[结果]在无线通信领域的实验中,无监督跨语言专利推荐方法的Top-1和Top-5推荐准确率分别达到55.63％和77.82％,较弱监督跨语言专利推荐方法分别提高了0.66％和1.45％,较基于机器翻译的跨语言专利推荐方法分别提高了4.29％和3.90％.[局限]仅对特定领域中英专利进行推荐,尚需扩展领域和语言范围.[结论]能够实现有效的中英跨语言专利推荐,并可扩展应用到其他领域和语种下的专利推荐中.

关键词：跨语言、专利推荐、表示学习、语义表示

所属期刊栏目：4

分类号：G254(图书馆学、图书馆事业)

资助基金：本文系国家自然科学基金项目“基于表示学习的专利信息语义融合与深度挖掘研究”;江苏省社会科学基金项目“基于社团结构动态演化的主题突变监测与形成机制研究”;国家自然科学基金项目“基于被引科学知识突变的突破性创新动态识别及其形成机理研究”

在线出版日期：2021-02-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：93-103

英文信息展示

期刊专题