基于语文教材语料库的文本阅读难度分级关键因素分析与易读性公式研究
文本阅读难度的自动判定对于分级教材的编纂与评估、分级阅读标准的制定与推广都有着重要的作用.本文以构建的中小学语文教材语料库为数据基础,分别从字、词、句子、篇章等不同层面对影响文本阅读难度的关键因素进行了统计关联分析,主要涉及到频率、长度、词类、词义类别、词语丰富性、句子变化度等17类、53种不同因素.在此基础上,本文构建了线性回归方程来检验这些因素与难度级别的预测效度,筛选有效参项,并最终建立文本易读性评价公式,其拟合优度达到0.71左右.研究表明,字频、词义丰富度、连词比例、物、动作、关联等词义类比例以及句长变化度等是区别文章难度级别的关键因素.
阅读难度、教材语料库、易读性公式
H195.4(汉语教学)
本研究得到教育部人文社会科学青年项目“基于多元特征融合的中小学汉语文本阅读难度自动分级研究”19YJCZH016
2020-05-07(万方平台首次上网日期,不代表论文的发表时间)
共12页
132-143