基于多元判别分析的文本分割模型
提出了一种独立于具体领域的文本线性分割统计模型,其中采用多元判别分析方法定义了4种全局评价函数,实现对文本分割模式的全局评价,寻找满足分割单元内距离最小化和分割单元间距离最大化条件的最好分割方式.该模型采用遗传算法来解决新模型的高计算复杂度问题.比较性实验结果显示,新模型比TextTiling和Dotplotting算法取得了更高的P?评价性能.
文本分割、多元判别分析、分割单元内距离、分割单元间距离、分割单元长度、遗传算法
18
TP391(计算技术、计算机技术)
国家自然科学基金60473140;国家高技术研究发展计划863计划2006AA01Z154;教育部跨世纪优秀人才培养计划NCET-05-0287;面向21世纪教育振兴行动计划985计划985-2-DB-C03
2007-04-09(万方平台首次上网日期,不代表论文的发表时间)
共10页
555-564