期刊专题

10.11925/infotech.2096-3467.2020.0272

基于表示学习的无监督跨语言专利推荐研究

引用
[目的]减少双语词典和大规模双语语料库的构建,提高专利文本语义的揭示和利用,从文本语义表示角度设计无监督的跨语言专利推荐方法,提高跨语言专利推荐效果和领域适用能力.[方法]首先设计无监督跨语言词向量映射方法,通过线性变换将独立的中英专利词向量映射到统一语义向量空间,构建中英词语间的语义映射关系;然后利用平滑倒词频的词向量加权方法,形成基于跨语言专利词向量的专利文本语义表示方法,实现中英专利文本在同一向量空间中的语义表示;最后应用向量相似度计算指标,计算不同语言专利文本间的语义相似度,构建基于表示学习的无监督跨语言专利推荐方法,实现跨语言专利推荐.[结果]在无线通信领域的实验中,无监督跨语言专利推荐方法的Top-1和Top-5推荐准确率分别达到55.63%和77.82%,较弱监督跨语言专利推荐方法分别提高了0.66%和1.45%,较基于机器翻译的跨语言专利推荐方法分别提高了4.29%和3.90%.[局限]仅对特定领域中英专利进行推荐,尚需扩展领域和语言范围.[结论]能够实现有效的中英跨语言专利推荐,并可扩展应用到其他领域和语种下的专利推荐中.

跨语言、专利推荐、表示学习、语义表示

4

G254(图书馆学、图书馆事业)

本文系国家自然科学基金项目“基于表示学习的专利信息语义融合与深度挖掘研究”;江苏省社会科学基金项目“基于社团结构动态演化的主题突变监测与形成机制研究”;国家自然科学基金项目“基于被引科学知识突变的突破性创新动态识别及其形成机理研究”

2021-02-25(万方平台首次上网日期,不代表论文的发表时间)

共11页

93-103

暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

4

2020,4(10)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn