10.3969/j.issn.1002-1965.2019.10.024
基于深度迁移学习的技术术语识别——以数控系统领域为例
新兴术语识别是新兴技术预见的一项重要工作,专利文献是技术情报的最新来源,被广泛地用于新兴技术预见.专利文献易于使用,但是术语难以挖掘、抽取难度大,存在缺乏术语标签的问题,目前未发现针对专利文献运用命名实体识别(NER)抽取技术术语的研究. [方法/过程]该文引入深度迁移学习的思想,利用成熟的公共领域源数据,运用Bi-LSTM(双向长短时记忆)模型实现跨领域迁移,有效识别技术术语并过滤高频非术语词串,通过聚类对识别术语划分技术类别. [结果/结论]以数控系统(CNC)领域专利文献为例,模型有效地将公共领域源数据已有知识迁移到科学领域目标数据,解决了专利文献少标注的问题,识别术语领域相关性强.以此划分的技术类别能为领域技术发展趋势研究提供数据支持.
新兴技术预见、命名实体识别、深度迁移学习、数控系统、专利分析
38
G306.0(科学研究理论)
国家自然科学基金项目"支持技术预见的多源异构大数据融合与时序文本预测方法研究"91646102;国家自然科学基金项目"面向2035的高端装备领域技术路线图总体框架及重点子领域研究"L1824039;国家自然科学基金项目"衍化升级情境下2035智能制造领域技术路线图应用研究:基于融合与派生路径"L172400022;教育部人文社会科学项目16JDGC011;中国工程科技知识中心建设项目"工程科技战略咨询智能支持系统建设"CKCEST-2019-2-13
2019-10-24(万方平台首次上网日期,不代表论文的发表时间)
共8页
168-175