基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大部分数据流分类算法解决了数据流无限长度和概念漂移这两个问题。但是,这些算法需要人工专家将全部实例都标记好作为训练集来训练分类器,这在数据流高速到达并需要快速分类的环境中是不现实的,因为标记实例需要时间和成本。此时,如果采用监督学习的方法来训练分类器,由于标记数据稀少将得到一个弱分类器。提出一种基于主动学习的数据流分类算法,该算法通过选择全部实例中的一小部分来人工标记,其中这小部分实例是分类置信度较低的样本,从而可以极大地减少需要人工标记的实例数量。实验结果表明,该算法可以在数据流存在概念漂移情况下,使用较少的标记数据对数据流训练出分类器,并且分类效果良好。
推荐文章
一种基于距离和采样机制的数据流分类方法
分类
集成学习
类分布不平衡
类标签缺失
基于分布式数据流的网络处理器数据收集分类平台
分布式数据流
网络处理器
数据收集
数据分类
分类平台
特征更新
基于堆叠集成的数据流分类
堆叠集成
数据流分类
概念漂移
数据流中概念漂移检测的集成分类器设计
数据挖掘
数据流
概念漂移
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 针对标记数据不足的数据流分类器
来源期刊 计算机工程与应用 学科 工学
关键词 数据流 分类 概念漂移 主动学习
年,卷(期) 2015,(6) 所属期刊栏目
研究方向 页码范围 124-128
页数 5页 分类号 TP181
字数 5422字 语种 中文
DOI 10.3778/j.issn.1002-8331.1304-0457
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 熊忠阳 重庆大学计算机学院 135 2447 25.0 44.0
2 张玉芳 重庆大学计算机学院 125 2737 26.0 48.0
3 周兴勤 重庆大学计算机学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (13)
参考文献  (2)
节点文献
引证文献  (3)
同被引文献  (1)
二级引证文献  (1)
1996(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
数据流
分类
概念漂移
主动学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导