期刊专题

10.11925/infotech.2096-3467.2021.0963

中文招聘文档中专业技能词抽取的跨域迁移学习

引用
[目的]利用在线招聘文档,准确分析用人单位需求,为解决劳动力供需失配提供技术支持.[方法]提出一种基于跨域迁移学习的专业技能词识别方法(CDTL-PSE).CDTL-PSE将专业技能词的识别任务当作序列标注任务,首先将SIGHAN语料库分解为三个源域,利用插入在Bi-LSTM层和CRF层之间的域自适应层来有效实现从各个源域到目标域的跨域迁移学习;然后采用参数迁移法训练每个子模型;最后通过多数投票获得标签序列的预测结果.[结果]在自建在线招聘文档数据集上,相对于基线方法,使用交替训练的具有Bi-LSTM域自适应层的CDTL-PSE的F1值提高0.91%,能减少50%左右的标记样本.[局限]模型的可解释性有待进一步改善.[结论]CDTL-PSE能有效实现对技能词的自动抽取,还可有效缓解目标域标注样本的不足.

专业技能词、跨域迁移学习、域自适应

6

TP393;G250(计算技术、计算机技术)

教育部人文社会科学研究项目;广西学位与研究生教育改革课题项目;广西自然科学基金项目

2022-06-23(万方平台首次上网日期,不代表论文的发表时间)

共15页

274-288

暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

6

2022,6(2)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn