10.3772/j.issn.1000-0135.2021.07.006
面向特定科研任务的著者姓名消歧方法
人才流动、学者评价等以学者个人为对象的研究任务,通常需要针对学术论著数据集中的著者进行姓名消歧.本文针对此类特定研究任务,提出了准确且便于学者操作的姓名消歧方法.为简便计算,弥补本地数据缺失的问题,本文构建了基于异源数据的二阶段姓名消歧框架.一阶段充分挖掘本地关联信息,二阶段结合权威的外源数据.基于表征进行本地关系发现、半模糊检索等步骤,以达到全面客观的姓名消歧,最终通过人工智能领域的论文数据和Aminer姓名消歧数据集,实现并验证该方法的优越性和普适性.经过与人工标注数据对比,该框架表现出良好的消歧效果,较好地解决了原始数据中的同名异人和同人异名问题,从而为后续研究任务奠定了扎实的基础.
特定研究任务;二阶段姓名消歧;异源数据;关系发现;半模糊检索
40
教育部人文社会科学基金项目"施引群体视角的科学产出评价方法研究";国家自然科学基金项目"引文模式视角下的科学突破研究";"引文扩散理论及实证研究"
2021-08-26(万方平台首次上网日期,不代表论文的发表时间)
共11页
734-744