期刊专题

10.13328/j.cnki.jos.004872

一种基于k近邻图的稀有类检测算法

引用
稀有类检测的目标是为无类别标签的数据集中的每个类,特别是仅含少量数据样本的稀有类,寻找到至少一个数据样本以证明数据集中存在这些类.该技术在金融欺诈检测及网络入侵检测等现实问题中具有广泛的应用场景.但是,现有的稀有类检测算法往往存在以下问题:(1)时间复杂度比较高;或(2)对原始数据集需要一定的先验知识,如数据集中各类数据样本所占比例等.提出了一种基于k邻近图的无先验快速稀有类检测算法KRED,通过利用稀有类数据样本在小范围内紧密分布所造成的与周边数据分布的不一致性来定位稀有类.为此,KRED将给定数据集转化为k邻近图,并计算图中各顶点入度和边长的变化.最后,将以上变化最大的顶点对应的数据样本作为稀有类的候选样本.实验结果表明:KRED有效提高了发现数据集中各个类的效率,明显缩短了算法运行所需时间.

稀有类检测、k邻近图、数据分布、变化系数、入度

27

TP311(计算技术、计算机技术)

国家自然科学基金61502347,61272275,61202033,61070013,U1135005;中央高校基本科研业务费专项资金2042015kf0038;武汉大学人才计划/引进人才科研启动经费National Natural Science Foundation of China61502347,61272275,61202033,61070013,U1135005;Fundamental Research Funds for the Central Universities2042015kf0038;Research Funds for Introduced Talents of Wuhan University

2016-12-13(万方平台首次上网日期,不代表论文的发表时间)

共12页

2320-2331

暂无封面信息
查看本期封面目录

软件学报

1000-9825

11-2560/TP

27

2016,27(9)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn