10.11925/infotech.2096-3467.2020.0272
基于表示学习的无监督跨语言专利推荐研究
[目的]减少双语词典和大规模双语语料库的构建,提高专利文本语义的揭示和利用,从文本语义表示角度设计无监督的跨语言专利推荐方法,提高跨语言专利推荐效果和领域适用能力.[方法]首先设计无监督跨语言词向量映射方法,通过线性变换将独立的中英专利词向量映射到统一语义向量空间,构建中英词语间的语义映射关系;然后利用平滑倒词频的词向量加权方法,形成基于跨语言专利词向量的专利文本语义表示方法,实现中英专利文本在同一向量空间中的语义表示;最后应用向量相似度计算指标,计算不同语言专利文本间的语义相似度,构建基于表示学习的无监督跨语言专利推荐方法,实现跨语言专利推荐.[结果]在无线通信领域的实验中,无监督跨语言专利推荐方法的Top-1和Top-5推荐准确率分别达到55.63%和77.82%,较弱监督跨语言专利推荐方法分别提高了0.66%和1.45%,较基于机器翻译的跨语言专利推荐方法分别提高了4.29%和3.90%.[局限]仅对特定领域中英专利进行推荐,尚需扩展领域和语言范围.[结论]能够实现有效的中英跨语言专利推荐,并可扩展应用到其他领域和语种下的专利推荐中.
跨语言、专利推荐、表示学习、语义表示
4
G254(图书馆学、图书馆事业)
本文系国家自然科学基金项目“基于表示学习的专利信息语义融合与深度挖掘研究”;江苏省社会科学基金项目“基于社团结构动态演化的主题突变监测与形成机制研究”;国家自然科学基金项目“基于被引科学知识突变的突破性创新动态识别及其形成机理研究”
2021-02-25(万方平台首次上网日期,不代表论文的发表时间)
共11页
93-103