10.3969/j.issn.1003-9767.2021.16.046
基于机器学习的数据类型识别方法
为优化数据类型识别技术,进一步完善数据类型识别的方法,改善当前数据类型识别难以识别出复合文件的问题.笔者通过对8种常见的数据类型进行实验,初步选定朴素贝叶斯等几种分类算法,并提出基于支持向量机(Support Vector Machine,SVM)的多方面参数选定方法,然后依据新的数据类型识别方法与传统文件类型分别进行对比实验,同时确定数据类型识别的函数分析方法.通过实验可知,基于SVM支持向量机算法的数据类型识别方法建模时间长,但识别率高,被认定为以后要采用的新的基于机器学习的数据类型识别方法.
机器学习;文件类型;支持向量机算法;文件碎片
33
TP393(计算技术、计算机技术)
2021-12-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
150-153