10.3969/j.issn.1002-1965.2008.03.032
一种基于隐马尔可夫聚类的信息提取方法
为了通过统计的学习来得到最优的模型参数,我们通过基于形式的聚类方法将训练数据聚成几个类,每个类的数据被用来训练一个初始概率和一个转移概率矩阵.在进行文本信息提取时,结合每一个初始概率矩阵、每一个转移概率矩阵,使用Viterbi算法来找出最优的标记序列.结果这些最优的标记序列中概率最大的标记序列将被作为最终输出.实验表明,新的算法在一定条件下能提高文本信息提取的精确度和召回率.
聚类、信息提取、隐马尔可夫模型
27
G35(情报学、情报工作)
辽宁省教育厅资助项目2004D110
2008-05-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
96-98