10.3772/j.issn.2095-915x.2019.03.006
面向学术文献的学者兴趣标签识别方法
学术文献是科学进步与发展的载体,各种元数据信息包括作者、论文、期刊以及这些实体之间的关系,具有重要的价值,如何精准构建学者用户画像是一个具有挑战性的问题.早期的用户画像相对简单,区分度以及可用性都不高.本文在"2017开放学术精准画像大赛"TASK3的真实数据上,提取学者与期刊的关系和学者与论文的关系,设计关系模型并采用LSI降维技术以及文本相似度计算,对学者兴趣标签进行识别与评估,并进行数据可视化分析.实验结果表明,使用本文提出的方法可准确有效的识别学者兴趣标签,准确率为P@1=92%、P@2=94%、P@3=98%.
用户画像、兴趣标签识别、LSI
5
G35(情报学、情报工作)
2019-09-06(万方平台首次上网日期,不代表论文的发表时间)
共9页
65-73