基于Hadoop MapReduce的分布式数据流聚类算法研究

任家东; 朱世伟; 蔡斌雷; 郭芹

文献导航

搜索文章

搜索思路

钛学术文献服务平台 \
学术期刊 \
工业技术期刊 \
大学学报期刊 \
信息工程大学学报期刊 \
基于Hadoop MapReduce的分布式数据流聚类算法研究

基于Hadoop MapReduce的分布式数据流聚类算法研究

作者：

任家东朱世伟蔡斌雷郭芹

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

数据挖掘

聚类

数据流聚类

分布式聚类

Hadoop MapReduce

摘要：

随着数据流规模的持续增大,现有基于网格的聚类算法对数据流的聚类效果不好,不能实时发现任意形状的簇,也不能及时删除数据流中的噪声点.文章提出了一种Hadoop平台环境下基于网格密度的分布式数据流聚类算法(PGDC-Stream),利于基于Hadoop的MapReduce框架对数据流进行阶段化的并行聚类分析,实时发现数据流中任意形状的簇,定义检测周期和密度阈值函数并及时删除数据流中的噪声点.算法基于网格密度对数据流初始聚类后,随着新数据的到来,使用基于密度阈值函数的噪声点处理策略,周期性检测和删除噪声点,使用基于Hadoop MapReduce框架的并行分析模型周期性地调整已经生成的簇.实验结果表明,PG-DC-Stream对大规模数据流的聚类质量、可伸缩性和实时性都好于CluStream.

内容分析

关键词云

关键词热度

相关文献总数

(/次)

(/年)

文献信息

篇名	基于Hadoop MapReduce的分布式数据流聚类算法研究
来源期刊	信息工程大学学报	学科	工学
关键词	数据挖掘聚类数据流聚类分布式聚类 Hadoop MapReduce
年，卷（期）	2014,（4）	所属期刊栏目	计算机技术及应用
研究方向		页码范围	472-478
页数	7页	分类号	TP391
字数	4622字	语种	中文
DOI	10.3969/j.issn.1671-0673.2014.04.015

五维指标

作者信息

序号	姓名	单位	发文数	被引次数	H指数	G指数
1	任家东	燕山大学信息科学与工程学院	49	218	9.0	11.0
2	朱世伟	山东省科学院情报研究所	26	148	7.0	11.0
3	郭芹	济南大学泉城学院	9	20	2.0	4.0
4	蔡斌雷	山东省科学院情报研究所	4	10	1.0	3.0

传播情况

被引次数趋势

(/次)

(/年)

引文网络

二级参考文献 (15)

共引文献 (68)

参考文献 (2)

节点文献

引证文献 (9)

同被引文献 (68)

二级引证文献 (29)

1988(1)

参考文献（0）

二级参考文献（1）

1994(1)

参考文献（0）

二级参考文献（1）

1997(1)

参考文献（0）

二级参考文献（1）

1999(2)

参考文献（0）

二级参考文献（2）

2003(1)

参考文献（0）

二级参考文献（1）

2004(1)

参考文献（0）

二级参考文献（1）

2005(2)

参考文献（0）

二级参考文献（2）

2006(1)

参考文献（0）

二级参考文献（1）

2007(1)

参考文献（0）

二级参考文献（1）

2008(2)

参考文献（0）

二级参考文献（2）

2009(1)

参考文献（0）

二级参考文献（1）

2011(2)

参考文献（1）

二级参考文献（1）

2012(1)

参考文献（1）

二级参考文献（0）

2014(0)

参考文献(0)

二级参考文献(0)

引证文献(0)

二级引证文献(0)

2016(5)

引证文献（5）

二级引证文献（0）

2017(7)

引证文献（2）

二级引证文献（5）

2018(6)

引证文献（0）

二级引证文献（6）

2019(14)

引证文献（2）

二级引证文献（12）

2020(6)

引证文献（0）

二级引证文献（6）

研究主题发展历程

节点文献

数据挖掘

聚类

数据流聚类

分布式聚类

Hadoop MapReduce

研究起点

研究来源

研究分支

研究去脉

引文网络交叉学科

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

一般工业技术交通运输军事科技冶金工业动力工程化学工业原子能技术大学学报建筑科学无线电电子学与电信技术机械与仪表工业水利工程环境科学与安全科学电工技术石油与天然气工业矿业工程自动化技术与计算机技术航空航天轻工业与手工业金属学与金属工艺

信息工程大学学报2014年第6期信息工程大学学报2014年第5期信息工程大学学报2014年第4期信息工程大学学报2014年第3期信息工程大学学报2014年第2期信息工程大学学报2014年第1期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com