10.13663/j.cnki.lj.2018.12.007
一种针对已知作者的姓名消歧方法
在外文期刊数据库中,同一姓名简称代表多位作者的现象十分普遍,严重影响作者检索的精度.本次研究将规则与算法相结合,依据规则为分类算法标注训练数据,从而在无监督条件下使用有监督算法,实现作者的精确检索.该算法适用于论文查证等已知作者身份的姓名消歧问题,相比通用的消歧方法,该方法结合无监督算法无需人工标注的优点,以及有监督算法高效率、易对应实体的优点.实践结果表明,该方法具有较高的准确度.
作者姓名消歧、数据标注、分类算法、朴素贝叶斯
2019-01-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
56-63