期刊专题

10.11925/infotech.2096-3467.2021.0972

融合LSTM与逻辑回归的中文专利关键词抽取

引用
[目的]构建一种能够更加准确地抽取中文专利关键词的方法,解决传统方法难以发现低频、长尾关键词的问题.[方法]提出一种融合长短期记忆神经网络和逻辑回归模型的候选关键词抽取方法,进一步构建重组过滤规则,实现目标关键词抽取.[结果]实验结果表明,所提方法在所有关键词、低频关键词、长尾关键词、低频长尾关键词的抽取准确率比其他方法分别提高了 5、24、11、26个百分点.[局限]所提方法通过设定阈值实现关键词的分类,对阈值附近点的词语划分仍不够精确.[结论]融合长短期记忆神经网络和逻辑回归模型获取候选关键词,并基于重组过滤规则提取目标关键词,能够有效发现专利文本中的低频、长字符组成的关键术语,为专利文本分析等任务提供一定的参考价值.

关键词抽取、LSTM神经网络、逻辑回归、重组过滤

6

TP393(计算技术、计算机技术)

广东省普通高校青年创新人才类项目;广东省基础与应用基础研究区域联合青年基金项目;教育部人文社会科学研究项目

2022-06-23(万方平台首次上网日期,不代表论文的发表时间)

共10页

308-317

相关文献
评论
暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

6

2022,6(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn