10.3969/j.issn.1002-137X.2010.02.050
基于HMM的Web信息抽取算法的研究与应用
随着因特网技术的迅速发展,网上信息成几何级数增长,如何从这些海量联机非结构化文本中自动抽取出结构化信息成为目前重要的研究课题.研究了基于隐马尔可夫模型的Web信息抽取算法,着重探讨了隐马尔可夫模型在文本信息抽取中应该如何应用,数据应该如何标记,并对隐马尔可夫模型在文本信息抽取中的应用提出了几个改进的方法,建立了基于HMM的Web信息抽取模型,并对信息抽取后的数据进行了分析对比,验证了改进算法的有效性.
隐马尔可夫模型、信息抽取、机器学习
37
TP311.56(计算技术、计算机技术)
国家自然科学基金项目101022820080079
2010-04-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
203-206