融入案件辅助句的低频和易混淆罪名预测
由于低频罪名数据量较少和易混淆罪名案情描述相似等原因,导致低频和易混淆罪名预测效果不佳.为了解决此类问题,通过构建案件辅助句,提出一种基于双向互注意力机制的案件辅助句融合方法,实现罪名预测.主要包括以下3部分:首先,基于司法领域知识构建案件辅助句,将案件辅助句作为案情描述和罪名之间的映射知识;然后,基于词级和字符级表征分别提取案情描述与案件辅助句多粒度特征;同时,借助案件辅助句与案情描述双向注意机制,获得具有辅助句倾向性的案情描述表征,并最终实现低频和易混淆罪名的预测.基于中国刑事案件公共数据集的实验结果表明:所提方法在F1值最大提升13.2%,准确率最大提升4.5%,低频罪名预测F1值提升4.3%,易混淆罪名预测F1值提升8.2%,所提算法显著地提升了低频和易混淆罪名的预测性能.
低频罪名;易混淆罪名;双向互注意力;多粒度编码;案件辅助句
32
TP18(自动化基础理论)
国家重点研发计划;国家自然科学基金;云南省科技厅省级人培项目;云南省基础研究专项面上项目
2021-10-15(万方平台首次上网日期,不代表论文的发表时间)
共12页
3139-3150