基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法.
推荐文章
K-均值聚类算法在关系数据库中的应用
数据挖掘
聚类分析
K-均值
关系数据库
基于核的K-均值聚类
核K-均值聚类
K-均值聚类
核函数
支持向量机
基于主题模型的K-均值文本聚类
主题模型
向量空间模型
文本聚类
K-均值算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 K-均值文本聚类算法在智能答疑系统中应用
来源期刊 科技广场 学科 工学
关键词 文本聚类 K-均值 变量加权 子空间
年,卷(期) 2009,(1) 所属期刊栏目 数据库
研究方向 页码范围 75-78
页数 4页 分类号 TP301.6
字数 3314字 语种 中文
DOI 10.3969/j.issn.1671-4792.2009.01.024
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何月顺 东华理工大学信息工程学院 69 559 12.0 21.0
2 程铃钫 东华理工大学信息工程学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (18)
参考文献  (7)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(6)
  • 参考文献(0)
  • 二级参考文献(6)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(5)
  • 参考文献(5)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本聚类
K-均值
变量加权
子空间
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技广场
月刊
1671-4792
36-1253/N
大16开
南昌市省府大院北二路53号
44-66
1988
chi
出版文献量(篇)
11613
总下载数(次)
26
总被引数(次)
31625
论文1v1指导