融合SOM功能聚类与DeepFM质量预测的API服务推荐方法
由于越来越多的企业和组织纷纷将自己的业务、数据或资源封装成服务,并通过API的形式发布到互联网上,API服务的数量呈现倍增趋势.在此背景下,如何从这样一个大规模的API服务集合中,快速有效地找到满足开发者用户Mashup需求的API服务,已成为一个挑战性问题.为此,本文聚焦于“推荐合适的API服务以构建高质量Mashup应用”问题,以面向服务内容的功能聚类为基础,结合基于多维服务质量的评分预测,提出一种融合SOM功能聚类与DeepFM质量预测的API服务推荐方法,用于创建高质量的Mashup应用.该方法首先采用Wikipedia作为外部语料库扩充API服务文档的内容并利用HDP模型建模其主题分布.通过WikiExtractor抽取出Wikipedia中的语料数据,并利用Word2vec工具训练该语料数据获得其词向量模型.利用训练好的Wikipedia词向量模型对API服务描述文档进行扩充.针对扩充后的API服务文档,使用HDP主题建模技术,挖掘出其隐含的主题信息,自动确定最优主题个数,以准确地度量API服务文档之间的语义相似度.然后,采用SOM神经网络进行面向主题的API服务聚类.在HDP主题建模之后,对获得的“API服务文档-主题”向量采用SOM神经网络聚类算法进行主题聚类,通过自组织过程,将众多的API服务划分到不同的功能类簇中,每一个功能类中包含多个具有相似功能的API服务.接下来,针对API服务类簇中所有具有相似功能的API服务,利用DeepFM模型建模和挖掘其多维QoS属性之间的复杂交互关系,预测并排序API服务的质量得分.DeepFM模型自动地提取出QoS数据中(包括流行度、共现次数等)的有效的特征组合关系(包括高阶特征和低阶特征组合关系),预测并排序每一个API服务相对于目标Mashup应用的质量得分,推荐得分靠前的N个API服务给开发者用户.最后,在真实Web服务数据集上进行了实验比较与分析,实验结果表明:本文方法在准确率、召回率、纯度、熵、DCG、HMD等性能方面都要整体优于其它六种方法.相比于TF-IDF、LDA-K-CF、LDA-K-FM、HDP-K-CF、HDP-K-FM、HDP-S-FM,本文方法的准确率指标分别提升了196.2%、49%、33.8%、31.2%、12.3%、10.3%,DCG值分别提升了161.8%、26.4%、18.6%、16.2%、6.73%、4.5%.
API推荐、Mashup应用、HDP主题模型、SOM神经网络、深度因子分解机
42
TP301(计算技术、计算机技术)
国家自然科学基金61873316,61872139,61772193,61702181;湖南省自然科学基金2017JJ2098,2017JJ4036,2018JJ2139,2018JJ2136
2019-07-08(万方平台首次上网日期,不代表论文的发表时间)
共17页
1367-1383