10.3969/j.issn.1671-1122.2021.10.011
基于MRC的威胁情报实体识别方法研究
在威胁情报实体抽取领域,由于网络数据源结构复杂、无关信息多,且威胁情报实体具有专业性强、分类模糊等特点,传统实体识别方法对于威胁情报挖掘的效率不高.针对此问题,文章通过将实体识别转化为机器阅读理解的方式,提出一种融入专业知识的MRC指针标注模型(Threat Intelligence Machine Reading Comprehension,TIMRC),该模型能够为每个实体问题找到对应的开始和结尾索引.基于此,文章进一步构造了一种威胁情报实体识别(Threat Intelligence Entity Identification,TIEI)方法,通过对978篇安全类文章进行实验验证,证明了TIEI方法的有效性及高效的实体挖掘能力.
威胁情报;实体识别;机器阅读理解
TP309(计算技术、计算机技术)
国家自然科学基金[60704047;工业和信息化部智能制造项目[ZH-XZ-180004;中央高校基本科研业务费专项资金[JUSRP211A41,;111基地建设项目[B2018
2021-12-01(万方平台首次上网日期,不代表论文的发表时间)
共7页
76-82