基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了提高基于相似度矩阵的K-Means算法(SMK-means)处理大数据的能力,它使用MapReduce分布式编程模型,并结合SMK-means算法自身的特点,设计出了SMK-means算法基于MapReduce的并行化实现。通过设计Map和Reduce函数实现了SMK-means算法的并行化。Map函数通过计算样本和聚簇中心的相似度来确定样本的聚簇归属,Reduce函数用于完成聚簇中心的计算。实验结果证明,基于MapReduce的并行化的SMK-means算法在保证文本挖掘性能不降的前提下,使得运行效率得到了大幅度提升。
推荐文章
基于Spark的改进K-means算法的并行实现
聚类算法
简化轮廓系数
形态学相似距离
相似性度量
基于MapReduce框架下K-means的改进算法
MapReduce框架
K-means算法
数据挖掘
聚类分析
基于Spark的并行K-means算法研究
Spark
K-means
PSO
迭代计算
基于MapReduce的K-means聚类算法的优化
K均值算法
抽样
Canopy算法
最大最小距离法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于相似度矩阵的K-Means算法的MapReduce并行化实现
来源期刊 电脑知识与技术:学术交流 学科 工学
关键词 K-MEANS算法 相似度矩阵 MAPREDUCE模型 并行计算 文本挖掘
年,卷(期) 2017,(6X) 所属期刊栏目
研究方向 页码范围 18-20
页数 3页 分类号 TP391.1
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘鸿霞 中国政法大学图书馆 8 6 1.0 2.0
2 曹奇敏 中国政法大学图书馆 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
K-MEANS算法
相似度矩阵
MAPREDUCE模型
并行计算
文本挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术:学术版
旬刊
1009-3044
34-1205/TP
安徽合肥市濉溪路333号
26-188
出版文献量(篇)
41621
总下载数(次)
23
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导