10.16157/j.issn.0258-7998.223323
基于规则和词典的用电安全领域命名实体识别
在用电安全领域,存在着大量数据、知识未得到充分挖掘和利用,构建领域知识图谱不仅可以实现用电安全知识的整合,还能极大地提高电力行业的工作效率.命名实体识别是构建知识图谱的基础性工作,研究了基于字典和规则的命名实体识别,通过领域实体词典、构词特征字符规则匹配和词性组合特征规则匹配三种方法从非结构文本中准确地提取用电安全相关实体,为用电安全领域知识图谱的构建提供高质量和高精度的实体.为优化识别流程、提高响应速度,将通用词性标注任务交由边缘节点进行处理,中心服务器仅需响应规则模板匹配等任务.在小规模测试实验中,综合使用三种方法对用电安全文本进行领域实体识别,F1值能达到85%以上.
用电安全领域、命名实体识别、领域字典、特征字符规则、词性组合规则、边缘计算
48
TP391.1(计算技术、计算机技术)
国家电网有限公司总部科技项目5400-202118164A-0-0-00
2023-01-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
22-27