原文服务方: 微电子学与计算机       
摘要:
快速准确的在海量网络数据中发现热点主题对于网络舆情监控具有重要作用.针对K-means算法对初始中心点选择敏感和全局搜索能力不足的问题,提出一种基于Hadoop的改进灰狼优化K-means的IGWO-KM算法.首先,该算法将灰狼优化算法和K-means算法相结合,利用灰狼优化算法收敛速度快和可全局寻优的优势为K-means搜索最佳聚类中心,减小随机选取初始中心点而导致的聚类结果不稳定性,以获取更好的聚类结果.其次,使用非线性收敛因子改进灰狼优化算法,协调算法的全局和局部的搜索能力.然后,引入正弦余弦算法并进行改进,增强灰狼优化算法的全局搜索能力,优化寻优精度和收敛速度,避免陷入局部最优.之后,使用近邻空间球减少K-means聚类过程中冗余的距离计算加快算法收敛.最后,利用Hadoop集群可批量处理数据的特性,实现算法的并行化.实验结果表明,IGWO-KM算法具有更好的寻优精度和稳定性,相比于GWO-KM算法和K-means,该算法在查准率、召回率和F值均有明显提高,且具有良好的收敛速度和拓展性.
推荐文章
基于Spark的并行K-means算法研究
Spark
K-means
PSO
迭代计算
基于萤火虫优化的加权K-means算法
加权K-means
聚类
萤火虫算法
基于变异的k-means聚类算法
聚类
mk-means算法
变异
k-means算法的研究与改进
聚类
划分方法
数据样本
阈值
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop的灰狼优化K-means算法在主题发现的研究
来源期刊 微电子学与计算机 学科
关键词 文本聚类 K-means算法 主题发现 灰狼优化算法 分布式计算
年,卷(期) 2022,(4) 所属期刊栏目 计算机技术_人工智能与算法
研究方向 页码范围 24-32
页数 8页 分类号 TP319.9
字数 语种 中文
DOI 10.19304/J.ISSN1000-7180.2021.0862
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本聚类
K-means算法
主题发现
灰狼优化算法
分布式计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微电子学与计算机
月刊
1000-7180
61-1123/TN
大16开
1972-01-01
chi
出版文献量(篇)
9826
总下载数(次)
0
总被引数(次)
59060
论文1v1指导