10.3778/j.issn.1002-8331.1808-0098
针对恶意JavaScript识别的降维方法
针对将JavaScript代码N-gram处理后识别算法特征维度较高的问题,提出一种高效的降维方法.该方法利用TF-IDF-like模型分别计算特征在正常样本和恶意样本中的权重,基于特征权重在两类样本中的差异度进行降维.基于多个识别算法,将提出的降维方法与基于主成分分析(Principal Component Analysis,PCA)的降维方法进行比较,实验结果表明:当识别算法维度相同时,基于本文所给降维方法的识别算法在识别效果方面优于基于PCA的识别算法;当降维后识别算法的维度超过某个阈值时,随着识别算法维度的增长,本降维方法的时间开销增长速率远低于PCA方法.
降维、TF-IDF-like模型、特征差异度、JavaScript、主成分分析(PCA)
54
TP309(计算技术、计算机技术)
国家自然科学基金61379125
2018-11-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
20-24,36