期刊专题

10.11925/infotech.2096-3467.2018.0204

基于LDA模型的HSK作文生成

引用
[目的]研究HSK5作文自动生成,为汉语教师写作教学以及汉语学习者备考提供参考.[方法]将“HSK动态作文语料库”作为基本语料库,基于LDA模型训练语料库,融合交叉熵选择句子的策略,生成包含关键词的文本.通过人工评价,对比待评价文本和参考标准,对生成文本进行评分.[结果]实验结果表明,生成的文本内容包含所有关键词,且与主题相关.[局限]训练文本有一部分是改正后的HSK作文语料,来自母语为非汉语的外国人的作文,以致内容连贯性不强、内容不够丰富.[结论]该方法完成了根据关键词写作的任务,生成的文本可以很好地围绕关键词展开,并切合主题,本文提出的融合策略使生成的文本可读性较强.

自然语言生成、LDA模型、人工评价

2

TP391;G35(计算技术、计算机技术)

国家自然科学基金项目“中文专利侵权自动检测研究”61671070;国家语委重点项目“汉语智能写作关键技术研究及应用”项目ZDI135-53的研究成果之一

2018-11-20(万方平台首次上网日期,不代表论文的发表时间)

共8页

80-87

暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

2

2018,2(9)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn