10.3772/j.issn.1000-0135.2011.11.007
仅根据Proximity数据构建向量空间模型的方法


在实际应用中,许多研究对象都是抽象的,难以用某种特征向量的形式表示,这使得许多成熟的数据挖掘和机器学习方法难以被采用.不过,通常可将其转化成一个Proximity数据矩阵,使得矩阵中的元素表示两个对象间某种"比较"关系.针对该问题,本文提出仅根据Proximity数据矩阵利用多维尺度分析法(MDS)将研究对象进行向量化表示,即构建了一种向量空间模型.最后,对汉语科技词系统中的词语进行了聚类分析,结果表明,向量空间模型构建后再聚类的结果明显优于直接针对Proximity数据进行聚类分析的结果,从而验证了该方法的可行性和有效性.
多维尺度法、Proximity数据、向量空间模型、汉语科技词系统、聚类分析
30
TP3;TH1
"十一五"国家科技支撑计划"知识组织系统的集成及服务研究与实现"2006BAH03B03;中国科学技术信息研究所重点工作项目"汉语科技词系统建设与应用工程--新能源汽车领域完善及领域扩展"2008KP01-3-1
2011-12-19(万方平台首次上网日期,不代表论文的发表时间)
共8页
1163-1170