10.11925/infotech.2096-3467.2019.0034
基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究
[目的]从文本中抽取脆弱生态治理技术、实施地、实施时间等命名实体,并分析相关态势.[方法]利用Bi-LSTM+CRF结合基于特征的命名实体知识库对脆弱生态治理领域CNKI数据库中的相关文献进行脆弱生态治理技术、地名实体、时间实体的自动抽取和标记.[结果]对于中文文献中生态治理技术相关实体的抽取,获得P值74.34%、R值64.04%和F1值68.81%.采用Bi-LSTM+CRF神经网络模型与单纯采用CRF相比,P值提高9.41%,F1值提高4.26%,R值基本持平.[局限]依赖于中文分词工具的准确性;仅对相关的实体进行抽取,尚未抽取实体之间的关系.[结论]Bi-LSTM+CRF结合基于特征的命名实体知识库抽取命名实体技术,可用于基于细粒度内容的资源环境情报分析.
Bi-LSTM+CRF、文本挖掘、生态治理技术、命名实体识别
4
TP391(计算技术、计算机技术)
本文系国家重点研发计划“生态技术评价方法、指标体系及全球生态治理技术评价”项目“生态技术评价平台与集成系统研发”课题;国家自然科学基金项目“基于科学基金项目;知识产出的研究前沿探测”
2020-06-28(万方平台首次上网日期,不代表论文的发表时间)
共11页
78-88