10.3772/j.issn.1000-0135.2012.12.004
基于C4.5的维基百科页面信息质量评价模型研究
采用开放协同编辑模式的维基百科,其内容的精确性一直受到人们的质疑.除了极少部分被维基百科认定为高质量文章外,维基用户很难判断其余大部分文章的质量.对此,本文将维基百科中页面信息作为样本数据,把页面信息质量评价问题抽象为一个分类问题,构造了基于决策树C4.5的维基百科页面信息质量评价模型.并从页面编辑者情况和页面情况两个方面提出影响维基百科页面信息质量的15个的指标,给出了各指标的定义以及计算公式.最后,训练一个自动的页面信息质量分级评价模型并进行了有效性验证.实验证明,本文提出的维基百科页面信息质量分级评价模型能有效预测页面信息质量等级.
维基百科、信息质量、质量评价、分类模型
31
G25;G2
中央高校基本科研业务费专项DUT11RW306
2013-01-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
1259-1264