基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对大数据下基于密度的聚类算法中存在的数据网格划分不合理,聚类结果准确度不高以及并行化效率较低等问题,提出了基于MapReduce和加权网格信息熵的DBWGIE-MR算法.首先提出自适应网格划分策略(ADG)来划分网格单元;其次提出邻居网格扩展策略(NE)用于构建每个数据分区的加权网格,以此提高聚类效果;同时提出加权网格信息熵策略(WGIE)来计算网格密度以及密度聚类算法的ε邻域和核心对象,使密度聚类算法更适用于加权网格;接着结合MapReduce计算模型,提出并行计算局部簇算法(COMCORE-MR),从而加快获取局部簇;最后提出了基于并查集的并行合并局部簇算法(MECORE-MR),用于加快合并局部簇的收敛速度,提升了基于密度的聚类算法对局部簇合并的效率.实验结果表明,DBWGIE-MR算法的聚类效果更佳,且在较大规模的数据集下算法的并行化性能更好.
推荐文章
基于Spark并行的密度峰值聚类算法
聚类
密度峰值
空间划分
并行
Spark
基于网格的多密度聚类算法
密度阈值递减
多阶段聚类
边界点提取
基于网格相对密度差的扩展聚类算法
多密度聚类算法
网格相对密度差
扩展聚类
近邻估计法
边界点
模糊函数
基于方形邻域的网格密度聚类算法
聚类分析
密度聚类
方形邻域
网格
网格簇
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于加权网格和信息熵的并行密度聚类算法
来源期刊 计算机科学与探索 学科 工学
关键词 大数据 密度聚类 加权网格 信息熵
年,卷(期) 2020,(12) 所属期刊栏目 人工智能
研究方向 页码范围 2094-2107
页数 14页 分类号 TP311
字数 语种 中文
DOI 10.3778/j.issn.1673-9418.1912034
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡健 34 173 6.0 12.0
2 毛伊敏 48 203 8.0 12.0
3 徐锴滨 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (185)
共引文献  (550)
参考文献  (23)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1971(2)
  • 参考文献(1)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(5)
  • 参考文献(2)
  • 二级参考文献(3)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(7)
  • 参考文献(0)
  • 二级参考文献(7)
2011(7)
  • 参考文献(2)
  • 二级参考文献(5)
2012(16)
  • 参考文献(1)
  • 二级参考文献(15)
2013(11)
  • 参考文献(0)
  • 二级参考文献(11)
2014(24)
  • 参考文献(2)
  • 二级参考文献(22)
2015(21)
  • 参考文献(0)
  • 二级参考文献(21)
2016(50)
  • 参考文献(1)
  • 二级参考文献(49)
2017(24)
  • 参考文献(2)
  • 二级参考文献(22)
2018(11)
  • 参考文献(4)
  • 二级参考文献(7)
2019(5)
  • 参考文献(5)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大数据
密度聚类
加权网格
信息熵
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导