10.19363/J.cnki.cn10-1380/tn.2024.01.10
基于集成学习技术的恶意软件检测方法
近年来,低级别微结构特征已被广泛应用于恶意软件检测.但是,微结构特征数据通常包含大量的冗余信息,且目前的检测方法并没有对输入微结构数据进行有效地预处理,这就造成恶意软件检测需要依赖于复杂的深度学习模型才能获得较高的检测性能.然而,深度学习检测模型参数量较大,难以在计算机底层得到实际应用.为了解决上述问题,本文提出了一种新颖的动态分析方法来检测恶意软件.首先,该方法创建了一个自动微结构特征收集系统,并从收集的通用寄存器(General-Purpose Registers,GPRs)数据中随机抽取子样本作为分类特征矩阵.相比于其他微结构特征,GPRs特征具有更丰富的行为特征信息,但也包含更多的噪声信息.因此,需要对GPRs数据进行特征区间分割,以降低数据复杂度并抑制噪声.本文随后采用词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)技术从抽取的特征矩阵中选择最具区分性的信息来进行恶意软件检测.TF-IDF 技术可以有效降低特征矩阵的维度,从而提高检测效率.为了降低模型复杂度,并保证检测方法的性能,本文利用集成学习模型来识别恶意软件.实验表明,该集成学习模型具有99.3%的检测准确率,3.7%的误报率,优于其他现有方法且模型复杂度低.此外,该方法还可以用于检测真实数据中的恶意行为.
恶意软件检测、通用寄存器、集成学习、词频-逆文档频率
9
TP309.5(计算技术、计算机技术)
国家重点研发计划No.2018YFB2202100
2024-02-01(万方平台首次上网日期,不代表论文的发表时间)
共19页
137-155