10.3969/j.issn.1002-137X.2009.04.055
Web数据挖掘中的可信数据来源
从大量Web信息中获取有用的信息是Web数据挖掘的关键问题.如何评价web信息是否可信,现在主要方法是通过BadRank算法进行内容评测,或是通过链接权重进行相关引用数计算.可信数据来源是数据挖掘的前提,在基于关键词的数据挖掘中,通过评价挖掘所涉及的不同数据域,以及数据域自身的可信性,对在不同域所获得的挖掘数据给以权重,从而对挖掘结果的序列产生影响,提高挖掘算法在获取可信结果方面的效率.并通过试验测试了可信域评价的效果.
Web数据挖掘、Web可信数据、数据挖掘
36
TP338(计算技术、计算机技术)
863项目2007AA01Z425;973计划前期研究专项2007CB316502;国家自然基金项目60673157;中国矿业大学青年基金OD4544
2009-05-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
211-214