10.11925/infotech.2096-3467.2023.0492
面向TRIZ的专利技术三元组抽取研究与应用
[目的]针对专利技术三元组自动抽取的准确性和效率不高的问题,研究专利技术三元组抽取的模型,以提升个性化、细粒度、多维度的深度抽取与语义关联的准确性.[方法]针对技术问题、解决方案、技术功能与技术效果等4个技术主题维度,提出基于WeakLabel-Bert-BiGRU-CRF模型的抽取方法,使用宏平均等指标进行模型评估.[结果]选择石墨烯能量存储应用领域专利作为数据集,实验结果表明,相比于Bert-BiGRU-CRF模型,所提模型针对三元组抽取的宏平均超过0.8,进一步减轻了数据标注的工作量,抽取效果更好.[局限]所提模型需要领域专家和专利情报分析人员共同参与数据标注,标注质量的不同会对应用效果产生影响.[结论]基于WeakLabel-Bert-BiGRU-CRF模型,研建对应的原型系统,以便后续进一步使用与推广专利技术三元组抽取方法,在科技文献知识挖掘领域也有较广泛的应用前景.
TRIZ、三元组抽取、专利技术、WeakLabel-Bert-BiGRU-CRF
8
TP393;G250(计算技术、计算机技术)
2024-08-21(万方平台首次上网日期,不代表论文的发表时间)
共10页
158-167