作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种改进的k-means文本聚类优化方法k-meansSC,将待聚类文档集分词处理后提取主要词条集,并分别采用布尔函数、TFIDF函数表示文本特征向量,通过实验对比它们各自的优缺点。同时基于该词条集构建支持度矩阵与置信度矩阵,以此定义相似度计算公式,并在不同聚类个数条件下详细分析了该公式与其他距离计算公式的迭代次数及错误函数的表现情况,实验结果表明,在一定条件下采用TFIDF型文本特征向量能有效地提高运行效率及聚类有效性。
推荐文章
一种改进K-means聚类的FCMM算法
K-means聚类
萤火虫
最大最小距离
Tent映射
混沌搜索
基于增强蜂群优化与 K-means 的文本聚类算法
蜂群算法
公平操作
克隆操作
多样性
局部提炼
文本聚类
一种改进的简化均值粒子群K-means聚类算法
粒子群优化算法
简化粒子群
邻域最优粒子
K-means聚类
聚类数
初始聚类中心
一种基于密度的k-means聚类算法
聚类
k-means
信息熵
近邻密度
孤立点
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的k-means文本聚类优化方法
来源期刊 计算机与现代化 学科 工学
关键词 k-means 相似度 文本聚类 支持度 置信度
年,卷(期) 2015,(3) 所属期刊栏目 算法设计与分析
研究方向 页码范围 48-51,56
页数 5页 分类号 TP311
字数 3643字 语种 中文
DOI 10.3969/j.issn.1006-2475.2015.03.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王琼 常熟理工学院外国语学院 19 66 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (18)
参考文献  (5)
节点文献
引证文献  (5)
同被引文献  (0)
二级引证文献  (0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
k-means
相似度
文本聚类
支持度
置信度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导