期刊专题

10.3724/SP.J.1004.2014.00531

基于多源的跨领域数据分类快速新算法

引用
研究跨领域学习与分类是为了将对多源域的有监督学习结果有效地迁移至目标域,实现对目标域的无标记分类。当前的跨领域学习一般侧重于对单一源域到目标域的学习,且样本规模普遍较小,此类方法领域自适应性较差,面对大样本数据更显得无能为力,从而直接影响跨域学习的分类精度与效率。为了尽可能多地利用相关领域的有用数据,本文提出了一种多源跨领域分类算法(Multiple sources cross-domain classification, MSCC),该算法依据被众多实验证明有效的“罗杰斯特回归模型”与“一致性方法”构建多个源域分类器并综合指导目标域的数据分类。为了充分高效利用大样本的源域数据,满足大样本的快速运算,在MSCC 的基础上,本文结合最新的CDdual (Dual coordinate descent method)算法,提出了算法MSCC的快速算法MSCC-CDdual,并进行了相关的理论分析。人工数据集、文本数据集与图像数据集的实验运行结果表明,该算法对于大样本数据集有着较高的分类精度、快速的运行速度和较高的领域自适应性。本文的主要贡献体现在三个方面:1)针对多源跨领域分类提出了一种新的“一致性方法”,该方法有利于将MSCC 算法发展为MSCC-CDdual 快速算法;2)提出了MSCC-CDdual 快速算法,该算法既适用于样本较少的数据集又适用于大样本数据集;3) MSCC-CDdual 算法在高维数据集上相比其他算法展现了其独特的优势。

跨领域、多源、罗杰斯特回归、后验概率、分类

G63;O1

国家自然科学基金60903100,60975027资助Supported by National Natural Science Foundation of China 60903100,60975027

2014-04-03(万方平台首次上网日期,不代表论文的发表时间)

共17页

531-547

相关文献
评论
暂无封面信息
查看本期封面目录

自动化学报

0254-4156

11-2109/TP

2014,(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn