10.3969/j.issn.1673-9604.2018.02.232
一种结合深度学习和规则过滤的未登录词探索的方法
近年来;计算机中文自然语言技术的应用范围越加广泛,拓展应用到了情景语言学的研究过程中,新闻事件未登录词也成为了研究热点.由于新闻事件语料存在于特定的语域中,从情景语言学的角度出发可以看作是对新闻语境词汇进行预测,从计算机中文语言处理(NLP)的角度来看则是对新闻语料分词后,对词汇构词能力进行具体量化.分词是进行未登录词发现的关键之所在,本文结合了深度结构机器学习模型对中文句子进行切分后,使用有关约束和松弛变量预测候选未登录词,再根据现有词库过滤得到判定结果.
神经网络、情景语言学、未登录词发现
2018-03-06(万方平台首次上网日期,不代表论文的发表时间)
共1页
298