基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在开放环境下,数据流具有数据高速生成、数据量无限和概念漂移等特性.在数据流分类任务中,利用人工标注产生大量训练数据的方式昂贵且不切实际.包含少量有标记样本和大量无标记样本且还带概念漂移的数据流给机器学习带来了极大挑战.然而,现有研究主要关注有监督的数据流分类,针对带概念漂移的数据流的半监督分类的研究尚未引起足够的重视.因此,在全面收集数据流半监督分类研究工作的基础上,对现有带概念漂移的数据流的半监督分类算法进行了多角度划分;并以算法采用的分类器类型为线索,对已有的多个算法进行了介绍与总结,包括现有数据流半监督分类采用的概念漂移检测方法;在一些被广泛使用的真实数据集和人工数据集上,对部分代表性数据流半监督分类算法进行了多方面的比较与分析;最后,提出了当前概念漂移数据流半监督分类中一些值得进一步深入探讨的问题.实验结果表明:数据流半监督分类算法的分类准确率与众多因素有关,但与数据分布的变化关系最大.本综述将有助于感兴趣的研究者快速进入数据流半监督分类问题领域.
推荐文章
概念漂移数据流分类研究综述
大数据
概念漂移
增量学习
适应学习
数据流
数据流中概念漂移检测的集成分类器设计
数据挖掘
数据流
概念漂移
概念漂移数据流集成分类算法综述
动态数据流
集成
分类
概念漂移
增量学习
基于堆叠集成的数据流分类
堆叠集成
数据流分类
概念漂移
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 概念漂移数据流半监督分类综述
来源期刊 软件学报 学科 工学
关键词 数据挖掘 概念漂移 数据流 集成学习 半监督分类
年,卷(期) 2022,(4) 所属期刊栏目 面向开放场景的鲁棒机器学习专刊|SPECIAL ISSUE ON ROBUST MACHINE LEARNING IN THE OPEN-WORLD SCENARIOS
研究方向 页码范围 1287-1314
页数 28页 分类号 TP181
字数 语种 中文
DOI 10.13328/j.cnki.jos.006476
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据挖掘
概念漂移
数据流
集成学习
半监督分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导