10.3772/j.issn.1000-0135.2014.03.006
基于向量空间模型的标签树构建方法研究
分众分类系统标签具有语义模糊、不精确、随意的缺点,导致用户信息发现和分享效率低下.论文借助受控词表教育类高频主题词作为分众分类系统的检索入口词,Del.icio.us网站中用户、标签、资源三元组数据作为数据源,充分考虑用户、资源、标签三者之间的关系,使用资源数表示标签向量,并对标签进行相似性计算,运用系统聚类法计算其聚类系数,构建适合的标签簇,依据资源数量的大小建立标签层次结构,形成标签树.旨在提高标签检索效率,为进一步标签语义挖掘打好基础.
分众分类、受控词表、标签聚类、标签树
33
TH1;R56
国家社科基金“叙词表与分众分类系统的集成研究”的研究成果,项目11BTQ006
2014-07-04(万方平台首次上网日期,不代表论文的发表时间)
共7页
277-283