原文服务方: 西安工程大学学报       
摘要:
为了探究学生成绩与其毕业去向之间存在的内在关系,提出基于Hadoop的Canopy-K-means并行算法并进行分析.首先基于"最小最大原则"确定Canopy的初始中心点并快速粗糙聚类,将其作为K-means算法的初始聚类中心,并基于MapReduce计算框架实现其并行化.然后以西安工程大学2017届毕业生的教务数据为基础,进行海量教务数据的挖掘分析实验,完成相同毕业流向类型学生的聚类,同时分析各毕业流向与课程之间的内在联系.实验结果证明,改进后的Canopy-K-means算法在处理海量数据时,相比传统K-means算法,聚类收敛速度提高约2.1倍,准确率提高约15%,具有良好的聚类效果.
推荐文章
基于云计算的并行K-means聚类算法研究
云计算技术
Hadoop
MapReduce
K-means算法
基于Spark的并行K-means算法研究
Spark
K-means
PSO
迭代计算
基于Canopy的高效K-means算法
K-means
多核处理
Map-reduce
Canopy
基于Hadoop的灰狼优化K-means算法在主题发现的研究
文本聚类
K-means算法
主题发现
灰狼优化算法
分布式计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop的Canopy-K-means并行算法的学生成绩与毕业流向关系分析
来源期刊 西安工程大学学报 学科
关键词 Hadoop Canopy-K-means 最小最大原则 MapReduce 教务 毕业流向
年,卷(期) 2018,(6) 所属期刊栏目 计算机科学
研究方向 页码范围 705-712
页数 8页 分类号 TP391.1
字数 语种 中文
DOI 10.13338/j.issn.1674-649x.2018.06.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 薛涛 西安工程大学计算机科学学院 67 213 7.0 10.0
2 李婷 西安工程大学计算机科学学院 15 69 6.0 7.0
3 郭卫霞 西安工程大学计算机科学学院 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (126)
共引文献  (878)
参考文献  (19)
节点文献
引证文献  (6)
同被引文献  (40)
二级引证文献  (2)
1967(2)
  • 参考文献(0)
  • 二级参考文献(2)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(6)
  • 参考文献(1)
  • 二级参考文献(5)
2007(10)
  • 参考文献(1)
  • 二级参考文献(9)
2008(8)
  • 参考文献(2)
  • 二级参考文献(6)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(16)
  • 参考文献(1)
  • 二级参考文献(15)
2013(10)
  • 参考文献(0)
  • 二级参考文献(10)
2014(16)
  • 参考文献(3)
  • 二级参考文献(13)
2015(11)
  • 参考文献(0)
  • 二级参考文献(11)
2016(14)
  • 参考文献(4)
  • 二级参考文献(10)
2017(6)
  • 参考文献(2)
  • 二级参考文献(4)
2018(5)
  • 参考文献(5)
  • 二级参考文献(0)
2018(5)
  • 参考文献(5)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(3)
  • 引证文献(3)
  • 二级引证文献(0)
2020(5)
  • 引证文献(3)
  • 二级引证文献(2)
研究主题发展历程
节点文献
Hadoop
Canopy-K-means
最小最大原则
MapReduce
教务
毕业流向
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安工程大学学报
双月刊
1674-649X
61-1471/N
大16开
1986-01-01
chi
出版文献量(篇)
3377
总下载数(次)
0
总被引数(次)
15983
论文1v1指导