作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
获取数据流上样本的真实类别的代价很高,因此标记所有样本的方式缺乏实用性,而随机标记部分样本又会导致模型的不稳定.针对上述问题,文中提出基于聚类假设的数据流分类算法.基于通过聚类算法分到同类中的样本可能具有相同类别这一聚类假设,利用训练数据集上的聚类结果拟合样本的分布情况,在分类阶段有目的性地选取很难分类或潜在概念漂移的样本更新模型.为了训练数据集上每个类别的样本,建立各自对应的基础分类器,当数据流中样本的类别消失或重现时,只需要冻结或激活与之对应的基础分类器,而无需再重新学习之前已经掌握的知识.实验表明,文中算法能够在适应概念漂移的前提下,减少更新模型需要的样本数量,并且取得和当前数据流上的分类算法相当或更好的分类效果.
推荐文章
基于滑动窗口的动态数据流聚类算法研究
数据流
滑动窗口
聚类
数据挖掘
一种实现混合属性数据流聚类的算法
混合属性数据
相似性
k - 近邻算法
k - 均值聚类
分类属性
基于混合差分进化的滑动窗口数据流聚类算法研究
混合差分进化
滑动窗口
数据流
聚类
大数据下数据流聚类挖掘算法的优化分析
大数据
数据流
聚类
挖掘算法
时间衰减
F-Stream算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于聚类假设的数据流分类算法
来源期刊 模式识别与人工智能 学科 工学
关键词 概念漂移 数据流 分类 聚类
年,卷(期) 2017,(1) 所属期刊栏目
研究方向 页码范围 1-10
页数 10页 分类号 TP311
字数 9601字 语种 中文
DOI 10.16451/j.cnki.issn1003-6059.201701001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李南 福建农林大学计算机与信息学院 8 11 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (62)
共引文献  (49)
参考文献  (15)
节点文献
引证文献  (8)
同被引文献  (25)
二级引证文献  (5)
1960(1)
  • 参考文献(0)
  • 二级参考文献(1)
1967(3)
  • 参考文献(0)
  • 二级参考文献(3)
1996(5)
  • 参考文献(0)
  • 二级参考文献(5)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(9)
  • 参考文献(0)
  • 二级参考文献(9)
2007(3)
  • 参考文献(1)
  • 二级参考文献(2)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(8)
  • 参考文献(0)
  • 二级参考文献(8)
2011(11)
  • 参考文献(2)
  • 二级参考文献(9)
2012(9)
  • 参考文献(5)
  • 二级参考文献(4)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(3)
  • 参考文献(2)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(7)
  • 引证文献(4)
  • 二级引证文献(3)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
概念漂移
数据流
分类
聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导