基于IRPU算法的专利数据相似重复属性及记录检测方法
面向专利数据领域,从专利文献自身的特点及专利分析需求出发,基于RFMA算法和PCM算法提出一种改进的专利数据相似重复属性及记录检测方法,即IRPU算法.将该算法应用到专利数据中,对发明人属性和整体记录进行检测.实验结果表明,该方法适用于专利数据领域,具有较高的识别精度.
数据清洗、相似重复记录、相似重复属性、位置编码、专利
N99;TP311(情报学、情报工作)
中国博士后科学基金20100470389
2011-04-06(万方平台首次上网日期,不代表论文的发表时间)
46-51