基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
CFSFDP算法是一种基于密度的新型聚类算法.文中针对算法需使用决策图人工选取聚类中心点的问题,利用斜率思想找出聚类中心点与非聚类中心点间的分界点,在消除主观误差的同时实现了中心点的自动求取,并最终将算法使用Spark框架进行了并行化实现.实验结果表明,文中算法在消除人为误差的同时提升了算法效率,且并行后的算法具有良好的加速比与扩展性,适用于海量数据的聚类分析.
推荐文章
基于改进CFSFDP算法的电信投诉文本聚类方法
CFSFDP算法
文本聚类
电信投诉
密度
距离
差分进化
基于多密度峰值的CFSFDP算法改进
聚类
密度峰值
CFSFDP
归一化
集合
基于Spark框架的改进协同过滤算法
协同过滤
Spark
稀疏数
相似度计
等值连接
基于Spark框架的并行聚类算法
K-means
Spark
大数据
Hadoop
MapReduce
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Spark框架的CFSFDP改进算法
来源期刊 电子科技 学科 工学
关键词 Spark CFSFDP算法 决策图 密度峰值 聚类 并行化
年,卷(期) 2019,(5) 所属期刊栏目
研究方向 页码范围 38-43,54
页数 7页 分类号 TP301.6
字数 5149字 语种 中文
DOI 10.16180/j.cnki.issn1007-7820.2019.05.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张欣 贵州大学大数据与信息工程学院 48 197 8.0 11.0
2 张平康 贵州大学大数据与信息工程学院 9 27 3.0 4.0
3 李琪 贵州大学大数据与信息工程学院 7 18 3.0 4.0
4 张航 贵州大学大数据与信息工程学院 10 18 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (127)
共引文献  (809)
参考文献  (12)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1961(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(6)
  • 参考文献(0)
  • 二级参考文献(6)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(9)
  • 参考文献(0)
  • 二级参考文献(9)
2008(9)
  • 参考文献(2)
  • 二级参考文献(7)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(7)
  • 参考文献(0)
  • 二级参考文献(7)
2012(12)
  • 参考文献(0)
  • 二级参考文献(12)
2013(15)
  • 参考文献(0)
  • 二级参考文献(15)
2014(19)
  • 参考文献(1)
  • 二级参考文献(18)
2015(9)
  • 参考文献(1)
  • 二级参考文献(8)
2016(13)
  • 参考文献(3)
  • 二级参考文献(10)
2017(7)
  • 参考文献(5)
  • 二级参考文献(2)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Spark
CFSFDP算法
决策图
密度峰值
聚类
并行化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子科技
月刊
1007-7820
61-1291/TN
大16开
西安电子科技大学
1987
chi
出版文献量(篇)
9344
总下载数(次)
32
总被引数(次)
31437
论文1v1指导