作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的分类算法在对模型进行训练之前,需要得到整个训练数据集.然而在大数据环境下,数据以数据流的形式源源不断地流向系统,因此不可能预先获得整个训练数据集.研究了大数据环境下含有噪音的流数据的在线分类问题.将流数据的在线分类描述成一个优化问题,提出了一种加权的Naive Bayes分类器和一种误差敏感的(ErrorAdaptive)分类器,并通过真实的数据集对提出的算法进行了验证.实验结果表明,文中提出的误差敏感的分类器算法在系统没有噪音的情况下分类预测的准确性要优于相关的算法;此外,当流数据中含有噪音时,误差敏感的分类器算法对噪音不敏感,仍然具有很好的预测准确性,因此可以应用于大数据环境下流数据的在线分类预测.
推荐文章
基于集成分类器的数据流分类算法
数据流
基分类器
集成分类器
决策树
概念漂移
聚类
概念漂移数据流集成分类算法综述
动态数据流
集成
分类
概念漂移
增量学习
基于Storm的流数据KNN分类算法的研究与实现
Storm
KNN算法
流数据
大数据
数据划分
基于DELM的不确定数据流分类算法
不确定数据流
分类
概念漂移
分布式
极限学习机
概念往复
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于加权Bayes分类器的流数据在线分类算法研究
来源期刊 计算机科学 学科 工学
关键词 大数据 决策树 分类算法 流数据
年,卷(期) 2014,(5) 所属期刊栏目 软件与数据库技术
研究方向 页码范围 227-229,234
页数 4页 分类号 TP311
字数 4121字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 卢惠林 哈尔滨工业大学计算机学院 5 10 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (88)
参考文献  (8)
节点文献
引证文献  (5)
同被引文献  (16)
二级引证文献  (34)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(6)
  • 参考文献(0)
  • 二级参考文献(6)
2009(9)
  • 参考文献(1)
  • 二级参考文献(8)
2010(10)
  • 参考文献(4)
  • 二级参考文献(6)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(4)
  • 引证文献(1)
  • 二级引证文献(3)
2018(5)
  • 引证文献(1)
  • 二级引证文献(4)
2019(20)
  • 引证文献(0)
  • 二级引证文献(20)
2020(7)
  • 引证文献(0)
  • 二级引证文献(7)
研究主题发展历程
节点文献
大数据
决策树
分类算法
流数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
总被引数(次)
150664
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导