基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
研究跨领域学习与分类是为了将对多源域的有监督学习结果有效地迁移至目标域,实现对目标域的无标记分类。当前的跨领域学习一般侧重于对单一源域到目标域的学习,且样本规模普遍较小,此类方法领域自适应性较差,面对大样本数据更显得无能为力,从而直接影响跨域学习的分类精度与效率。为了尽可能多地利用相关领域的有用数据,本文提出了一种多源跨领域分类算法(Multiple sources cross-domain classification, MSCC),该算法依据被众多实验证明有效的“罗杰斯特回归模型”与“一致性方法”构建多个源域分类器并综合指导目标域的数据分类。为了充分高效利用大样本的源域数据,满足大样本的快速运算,在MSCC 的基础上,本文结合最新的CDdual (Dual coordinate descent method)算法,提出了算法MSCC的快速算法MSCC-CDdual,并进行了相关的理论分析。人工数据集、文本数据集与图像数据集的实验运行结果表明,该算法对于大样本数据集有着较高的分类精度、快速的运行速度和较高的领域自适应性。本文的主要贡献体现在三个方面:1)针对多源跨领域分类提出了一种新的“一致性方法”,该方法有利于将MSCC 算法发展为MSCC-CDdual 快速算法;2)提出了MSCC-CDdual 快速算法,该算法既适用于样本较少的数据集又适用于大样本数据集;3) MSCC-CDdual 算法在高维数据集上相比其他算法展现了其独特的优势。
推荐文章
一种基于多桥映射的跨领域文本分类方法
跨领域分类
多桥映射
主题
文本分类
一种改进EM算法的跨领域情感分类方法
跨领域情感分类
EM算法
特征迁移
基于word2vec的跨领域情感分类方法
语义特征
共现特征
词向量
跨领域情感分类
基于多任务学习的多源数据分类研究
多源学习
多分类
任务相关性
多任务学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多源的跨领域数据分类快速新算法
来源期刊 自动化学报 学科
关键词 跨领域 多源 罗杰斯特回归 后验概率 分类
年,卷(期) 2014,(3) 所属期刊栏目 论文与报告
研究方向 页码范围 531-547
页数 17页 分类号
字数 12161字 语种 中文
DOI 10.3724/SP.J.1004.2014.00531
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王士同 江南大学数字媒体学院 528 3424 23.0 37.0
2 许敏 江南大学数字媒体学院 45 204 9.0 13.0
6 顾鑫 江南大学数字媒体学院 13 236 8.0 13.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (10)
同被引文献  (15)
二级引证文献  (40)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(1)
2014(2)
  • 引证文献(1)
  • 二级引证文献(1)
2015(4)
  • 引证文献(3)
  • 二级引证文献(1)
2016(7)
  • 引证文献(2)
  • 二级引证文献(5)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(8)
  • 引证文献(1)
  • 二级引证文献(7)
2019(16)
  • 引证文献(2)
  • 二级引证文献(14)
2020(12)
  • 引证文献(0)
  • 二级引证文献(12)
研究主题发展历程
节点文献
跨领域
多源
罗杰斯特回归
后验概率
分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
自动化学报
月刊
0254-4156
11-2109/TP
大16开
北京市海淀区中关村东路95号(北京2728信箱)
2-180
1963
chi
出版文献量(篇)
4124
总下载数(次)
26
论文1v1指导