基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
数据流环境下的高维、属性冗余、含噪音等问题是经常且可能同时存在的,在一定程度上影响了数据流的分类效果.为改善这一现状,提出一种快速、有效的数据流特征选择方法.引入统计指标Ⅳ( information value)值作为特征重要度的评价标准,在此基础上依据经验阈值来进行特征选择,从而解决了传统特征选择方法时空效率不高、区分度不明显、难以应用数据流的问题.实验结果表明:FS-Ⅳ具有较小的时间开销和较好的抗噪性能,该方法与已有的数据流分类模型相结合,在保证分类精度可比的情况下,能显著提高时空性能.
推荐文章
一种适用于流式大数据系统测试的数据生成方法
流式大数据生成
非线性相关性
时序相关性
流速控制
一种基于距离和采样机制的数据流分类方法
分类
集成学习
类分布不平衡
类标签缺失
一种适用于基因表达数据的特征加权FCM算法
基因表达数据
预处理算法
类间熵
加权模糊聚类
适用于IDS中数据分类的数值归约算法
数据挖掘
入侵检测系统
分类
数值归约
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种适用于数据流分类的特征选择方法
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 数据流分类 特征选择 Ⅳ值
年,卷(期) 2011,(12) 所属期刊栏目 计算机技术、电信技术
研究方向 页码范围 2247-2251
页数 5页 分类号 TP18
字数 语种 中文
DOI 10.3785/j.issn.1008-973X.2011.12.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡学钢 314 3156 27.0 39.0
2 张玉红 32 260 10.0 14.0
3 杨秋洁 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (28)
共引文献  (181)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(3)
  • 参考文献(1)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(5)
  • 参考文献(2)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(6)
  • 参考文献(0)
  • 二级参考文献(6)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据流分类
特征选择
Ⅳ值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导