重复模式识别算法及在Web信息抽取和聚类分析中的应用
序列中的重复模式识别算法及应用研究是数据挖掘领域的重要问题,是提取序列中有用信息的主要手段之一.近年来,针对各种重复模式定义、有效的识别算法设计以及重复模式识别算法在有关领域中的应用有了很多研究成果.文中对序列中重复模式的类型与特点作了描述,讨论了识别算法中常用的数据结构,以分类的方式重点回顾并总结了近年来重复模式在一些相关领域中的应用及相关算法的设计思路与技巧,并从加入的领域知识及约束、识别结果与算法扩充性、存在的主要问题等方面进行了讨论,其中包括在网络信息抽取、Web文档特征提取与聚类算法及相关的维文信息处理等领域中的应用.最后,讨论了关于序列重复模式识别算法在各个相关领域中的应用研究所面临的挑战,并探讨了未来的研究方向.
重复模式、Web文档特征、网络信息抽取、聚类算法、维文信息处理
44
TP391(计算技术、计算机技术)
国家自然科学基金61263044;新疆维吾尔自治区2015年双语教育研究项目SY20153136
2018-01-24(万方平台首次上网日期,不代表论文的发表时间)
共7页
39-45