10.3969/j.issn.1008-0821.2018.10.009
实体—属性抽取的GRU+CRF方法
[目的/意义]研究利用深度学习的循环神经网络GRU结合条件随机场CRF对标注的中文文本序列进行预测,来抽取在线评论文本中的实体—属性.[方法/过程]首先根据设计好的文本序列标注规范,对评论语料分词后进行实体及其属性的命名实体标注,得到单词序列、 词性序列和标注序列;然后将单词序列、 词性序列转为分布式词向量表示并用于GRU循环神经网络的输入;最后输出层采用条件随机场CRF,输出标签即是实体或属性.[结果/结论]实验结果表明,本文的方法将实体—属性抽取简化为命名实体标注,并利用深度学习的GRU捕获输入数据的上下文语义以及条件随机场CRF获取输出标签的前后关系,比传统的基于规则或一般的机器学习方法具有较大的应用优势.
实体属性抽取、GRU、循环神经网络、条件随机场、命名实体识别
38
TP391.1(计算技术、计算机技术)
国家社会科学基金项目 "基于数据驱动的图书馆资源发现系统平台研究" 16BTQ026
2018-10-29(万方平台首次上网日期,不代表论文的发表时间)
共8页
57-64