基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对高速数据流的流速超过集合分类器的处理能力,集合分类器无法训练全部最近到达的数据以更新分类器模型的问题,提出一种偏倚抽样集合分类器算法.通过偏差方差分解方法分析集合分类器的期望错误,利用计算待抽样数据的期望错误贡献度,实现数据的偏倚抽样,有效缩减了集合分类器的训练更新时间.与随机抽样集合分类器方法进行了比较.理论分析和实验结果表明,在抽样比例相同的条件下,该方法可以有效提高集合分类器的分类准确率.
推荐文章
基于堆叠集成的数据流分类
堆叠集成
数据流分类
概念漂移
基于分布式数据流的网络处理器数据收集分类平台
分布式数据流
网络处理器
数据收集
数据分类
分类平台
特征更新
数据流中概念漂移检测的集成分类器设计
数据挖掘
数据流
概念漂移
面向数据流的频繁模式挖掘研究
数据流
数据挖掘
数据流挖掘
频繁模式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向高速数据流的偏倚抽样集合分类器
来源期刊 北京邮电大学学报 学科 工学
关键词 数据流 集合分类器 偏倚抽样 偏差方差分解
年,卷(期) 2010,(4) 所属期刊栏目
研究方向 页码范围 44-48
页数 分类号 TP301
字数 3603字 语种 中文
DOI 10.3969/j.issn.1007-5321.2010.04.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张健沛 哈尔滨工程大学计算机科学与技术学院 156 1356 19.0 28.0
2 杨静 哈尔滨工程大学计算机科学与技术学院 178 2073 24.0 37.0
3 杨显飞 哈尔滨工程大学计算机科学与技术学院 4 18 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (55)
参考文献  (5)
节点文献
引证文献  (3)
同被引文献  (5)
二级引证文献  (8)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(4)
  • 参考文献(2)
  • 二级参考文献(2)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(3)
  • 引证文献(2)
  • 二级引证文献(1)
2012(2)
  • 引证文献(1)
  • 二级引证文献(1)
2013(2)
  • 引证文献(0)
  • 二级引证文献(2)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
数据流
集合分类器
偏倚抽样
偏差方差分解
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京邮电大学学报
双月刊
1007-5321
11-3570/TN
大16开
北京海淀区西土城路10号
2-648
1960
chi
出版文献量(篇)
3472
总下载数(次)
19
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导