一种基于流形距离的中文语块聚类分析方法
将中文语块分析看做词在句子内部聚类并标记语块类别的过程,建立了中文语块分析的聚类模型.首先构建词的语法功能空间,使用ISOMAP方法重构词空间的低维流形嵌入,进而考察词在低维空间中的分布情况.在使用层次聚类方法分析语块时,使用流形上的距离替代传统的欧式距离,在算法复杂度可以接受的范围内,提高了语块分析效果.
语块分析、流形距离、层次聚类、语法功能空间
49
TP391(计算技术、计算机技术)
新闻出版重大科技工程项目1041STC40889
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
126-132