10.3969/j.issn.1002-1965.2009.01.005
IRP中基于聚类分析的主题数据库划分研究
在亲合度的基础上定义出实体之间的距离公式,并进一步定义出单个实体与实体集之间的平均距离公式,作为实体划分的标准,并结合k-means算法对主题数据库进行划分.此方法改进了亲合度利用单个实体参与的活动数作为划分依据的缺点,更好地体现实体之间的联系,有助于信息资源的规划.
k-means算法、主题数据库、亲合度、平均距离
28
TP311(计算技术、计算机技术)
国家科技部高新技术计划项目"基于ASP的中小企业信息化服务系统"2005EJ000017;国家电子信息发展基金及河北省信息产业发展计划项目"供电企业计算机集成信息系统CIIS"2005035025
2009-04-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
17-18,16