10.3969/j.issn.0490-6756.2019.03.015
基于BLSTM-CRF模型的安全漏洞领域命名实体识别
非结构化文本资源提供了大量与漏洞相关的信息,传统的特定领域实体识别依赖特征模板和领域知识来识别相关实体,其识别性能很大程度上依赖于人工选取的特征函数质量.如何利用机器挖掘文本隐含的特征,而不需要人工详细地制定领域术语的特征表达是一项具有挑战性的任务.该文针对安全漏洞领域,提出一种双向长短期记忆网络BLSTM与条件随机场CRF相结合的安全漏洞领域实体识别模型,并使用基于词典的方法对结果进行校正,F值可达到85%以上.实验表明,该方法在提高实体识别的准确率和召回率的同时,能够显著地降低人工选取特征的工作量.
安全漏洞、实体识别、BLSTM、CRF
56
TP391.1(计算技术、计算机技术)
国家重点研发计划网络空间安全重点专项2017YFB0802900
2019-08-05(万方平台首次上网日期,不代表论文的发表时间)
共7页
469-475