基于IR2Vec模型的跨架构密码算法识别
在信息安全领域,加密技术被用来保障信息的安全性,在可执行文件中识别密码算法对于保护信息安全有着重要意义.现有密码算法识别技术大多只能针对单一架构,在跨架构场景下识别能力较差,因此,提出了IR2Vec模型,着力解决跨架构下的密码算法识别问题.该模型首先基于LLVM衔接不同的前端和后端的特性来解决跨架构的问题,利用LLVM-RetDec将可执行文件反编译成中间表示语言,然后改进PV-DM模型将中间表示语言语义向量化,通过求取向量的余弦距离来判断语义相似性.收集多种密码算法来建立密码算法库,将待检测目标可执行文件分别与密码算法库中的文件进行一一对比,取相似度最高的为识别结果.实验结果表明,该技术能够有效识别出可执行文件中的密码算法,该模型可同时支持X86,ARM 和MIPS 3 种架构,Clang和GCC 两种编译器,以及O0,O1,O2 和O3 这4 种优化选项的二进制文件交叉识别.
相似性识别、跨架构、密码算法、LLVM
50
TP393(计算技术、计算机技术)
2023-09-06(万方平台首次上网日期,不代表论文的发表时间)
共7页
720-726