基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章在分析关联规则和Apriori算法原理的基础上,针对Apriori算法扫描数据库时由于事务数过大,导致系统的I/O负载和CPU运算压力过大等弊端,提出一种主要针对大数据量情况下Apriori算法性能提升的改进算法.主要思想是通过抽样和事务压缩来减少算法需要扫描的事务数,进而提升算法的效率.同时,基于主流的weka开源数据挖掘工具实现了改进算法.实验结果表明了算法的有效性.
推荐文章
SaaS模式下大数据量统计框架的研究和实现
软件即为服务
数据统计
性能
大数据量Excel数据导入系统的设计与实现
大数据量
Excel
SQL Server
多线程
Merge
高压脉冲治疗仪中大数据量通讯的设计与实现
串行通讯
高压脉冲电穿孔治疗仪
抗干扰设计
大数据量传输
内存映射文件在大数据量海洋调查数据处理中的应用
内存映射文件
Windows
API
数据处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大数据量下的Apriori改进算法及在weka平台的实现
来源期刊 电子技术 学科 工学
关键词 数据挖掘 关联规则 Apriori 事务压缩 抽样 weka
年,卷(期) 2012,(7) 所属期刊栏目 电子技术研发
研究方向 页码范围 1-4
页数 分类号 TP311.13
字数 3159字 语种 中文
DOI 10.3969/j.issn.1000-0755.2012.07.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐俊刚 中国科学院研究生院 36 499 10.0 22.0
2 范多锋 中国科学院研究生院 2 17 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (32)
参考文献  (2)
节点文献
引证文献  (11)
同被引文献  (27)
二级引证文献  (12)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(3)
  • 引证文献(3)
  • 二级引证文献(0)
2017(4)
  • 引证文献(4)
  • 二级引证文献(0)
2018(3)
  • 引证文献(0)
  • 二级引证文献(3)
2019(9)
  • 引证文献(0)
  • 二级引证文献(9)
研究主题发展历程
节点文献
数据挖掘
关联规则
Apriori
事务压缩
抽样
weka
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子技术
月刊
1000-0755
31-1323/TN
大16开
上海市长宁区泉口路274号
4-141
1963
chi
出版文献量(篇)
5480
总下载数(次)
19
总被引数(次)
22245
论文1v1指导