基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对日益增长的海量数据和信息,通常采取有效的采样技术对大数据集进行采样,然后通过对样本的分析得到数据总体的相关模式.首先论述了关于样本的一些基本概念:利用采样技术对大数据集和海量数据进行分析处理,讨论了普通抽样技术与数据挖掘中的采样技术的异同.然后对目前普遍采用的采样技术进行了分类,重点研究了简单随机采样和分层随机采样,并对不同采样技术进行了比较.最后给出数据挖掘中利用采样技术的一个实现.
推荐文章
Web数据挖掘技术的研究
数据挖掘
Web数据挖掘
XML
数据挖掘中并行技术的研究与应用
数据挖掘
并行技术
多线程技术
搜索引擎
数据挖掘集成技术研究
数据挖掘
集成
数据库
数据仓库
数据挖掘中聚类分析的技术方法
数据掺掘
聚类分析
聚类算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据挖掘中采样技术的研究
来源期刊 系统工程与电子技术 学科 工学
关键词 样本 简单随机采样 分层随机采样 数据挖掘 模式
年,卷(期) 2005,(11) 所属期刊栏目 软件、算法与仿真
研究方向 页码范围 1946-1949
页数 4页 分类号 TP393
字数 4951字 语种 中文
DOI 10.3321/j.issn:1001-506X.2005.11.037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 秦小麟 南京航空航天大学信息科学与技术学院 175 1597 20.0 30.0
2 郑吉平 南京航空航天大学信息科学与技术学院 19 119 7.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (23)
参考文献  (1)
节点文献
引证文献  (18)
同被引文献  (10)
二级引证文献  (22)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(2)
  • 引证文献(2)
  • 二级引证文献(0)
2008(3)
  • 引证文献(2)
  • 二级引证文献(1)
2009(2)
  • 引证文献(1)
  • 二级引证文献(1)
2010(3)
  • 引证文献(2)
  • 二级引证文献(1)
2011(6)
  • 引证文献(1)
  • 二级引证文献(5)
2012(7)
  • 引证文献(2)
  • 二级引证文献(5)
2013(6)
  • 引证文献(2)
  • 二级引证文献(4)
2014(3)
  • 引证文献(1)
  • 二级引证文献(2)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
样本
简单随机采样
分层随机采样
数据挖掘
模式
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
系统工程与电子技术
月刊
1001-506X
11-2422/TN
16开
北京142信箱32分箱
82-269
1979
chi
出版文献量(篇)
10512
总下载数(次)
24
总被引数(次)
116871
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导