10.11925/infotech.2096-3467.2018.0204
基于LDA模型的HSK作文生成
[目的]研究HSK5作文自动生成,为汉语教师写作教学以及汉语学习者备考提供参考.[方法]将“HSK动态作文语料库”作为基本语料库,基于LDA模型训练语料库,融合交叉熵选择句子的策略,生成包含关键词的文本.通过人工评价,对比待评价文本和参考标准,对生成文本进行评分.[结果]实验结果表明,生成的文本内容包含所有关键词,且与主题相关.[局限]训练文本有一部分是改正后的HSK作文语料,来自母语为非汉语的外国人的作文,以致内容连贯性不强、内容不够丰富.[结论]该方法完成了根据关键词写作的任务,生成的文本可以很好地围绕关键词展开,并切合主题,本文提出的融合策略使生成的文本可读性较强.
自然语言生成、LDA模型、人工评价
2
TP391;G35(计算技术、计算机技术)
国家自然科学基金项目“中文专利侵权自动检测研究”61671070;国家语委重点项目“汉语智能写作关键技术研究及应用”项目ZDI135-53的研究成果之一
2018-11-20(万方平台首次上网日期,不代表论文的发表时间)
共8页
80-87