10.3969/j.issn.0490-6756.2019.03.011
基于文本嵌入特征表示的恶意软件家族分类
自动化、高效率和细粒度是恶意软件检测与分类领域目前面临的主要挑战.随着深度学习在图像处理、语音识别和自然语言处理等领域的成功应用,其在一定程度上缓解了传统分析方法在人力和时间成本上的巨大压力.因此本文提出一种自动、高效且细粒度的恶意软件分析方法-mal2vec,其将每个恶意软件看成是一个具有丰富行为语义信息的文本,文本的内容由恶意软件动态执行时的API序列构成,采用经典的神经概率模型Doc2Vec对文本集进行训练学习.实验结果表明,与Rieck[1]等人的分类效果相比,本文方法得到的效果有明显提升.特别的,不同于其他深度学习的方法,本文方法能够抽取模型训练的中间结果进行显式表示,这种显式的中间结果表示具有可解释性,可以让我们从细粒度层面分析恶意软件家族的行为模式.
恶意软件、分类、文本嵌入、Doc2Vec
56
TP309.7(计算技术、计算机技术)
国家重点研发计划项目2018YFB0804503,2016QY06X1205;装备预研教育部联合基金6141A02011607,6141A02033304;四川省重点研发计划项目18ZDYF3867,2017GZDZX0002
2019-08-05(万方平台首次上网日期,不代表论文的发表时间)
共9页
441-449