10.11925/infotech.2096-3467.2019.0554
基于专利科学引文内容表示学习的科学技术主题关联分析研究
[目的]从专利科学引文的文本内容语义表示角度,形成专利科学引文内容挖掘技术和方法,探索科学技术在内容层次上的关联关系,提高科学技术关联分析的准确性、全面性和可解释性.[方法]识别和抽取专利科学引文的关键词、摘要等特征项表示专利科学引文内容,利用文本表示学习方法对内容特征项进行语义向量表示,基于向量相似度计算方法计算特征项间的语义相似度,进而通过聚类方法分别得到专利技术与专利科学引文内容的研究主题,并分析特定领域科学技术间的主题关联.[结果]在纳米技术领域的实证分析表明,该方法能更好地发现科学技术间主题映射和关键词对应关系,从内容角度深入分析了科学技术间的主题关联关系.[局限]仅从专利以及专利科学引文的摘要和关键词层面进行探索性研究,使得专利全文本内容表示和分析的广度和深度还不够,分析维度的多样化还需加强.[结论]该方法能够从内容层面提高科学技术间的主体关联分析效果,结果可解释性更强.
专利科学引文、表示学习、主题关联、内容挖掘
3
G254(图书馆学、图书馆事业)
本文系国家自然科学基金面上项目“基于表示学习的专利信息语义融合与深度挖掘研究”;国家重点研发计划子课题“知识产权大数据挖掘技术、智能推送技术及应用示范”;江苏省社会科学基金青年项目“基于社团结构动态演化的主题突变监测与形成机制研究”
2020-06-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
52-60