10.16791/j.cnki.sjg.2022.02.002
基于Hadoop的并行化命名实体识别模型研究
针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型.提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点.与已有的BERT-BAC模型相比,在确保较高F1值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实体识别时间分别缩短60.36%、39.43%,具有更广泛的实用性.
命名实体识别、数据分块、Hadoop、并行化、局部注意力
39
TP301.6(计算技术、计算机技术)
国家重点研发计划;国家重点研发计划
2022-04-02(万方平台首次上网日期,不代表论文的发表时间)
共7页
7-12,39