基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对信息挖掘中的文本自动聚类问题,提出了一种基于模糊向量空间模型的核聚类算法.首先对聚类文本进行模糊特征提取得到模糊特征项集,然后依据模糊特征项集对每篇文本计算特征项的文档频数,进而得出每篇文本的模糊特征向量.最后利用高斯核函数将每篇文本的特征向量映射到高维特征空间,在高维特征空间中利用核聚类算法实施文本聚类.该方法在特征提取时充分考虑了特征项在文档中的位置信息,使自动聚类原则更接近手工聚类方法.以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性.
推荐文章
基于主题概念聚类的中文文本聚类
中文文本聚类
HowNet
主题概念
Chmeleon算法
基于GA优化QPSO算法的文本聚类
文本聚类
粒子群优化算法
量子行为粒子群优化算法
遗传算法
基于文本挖掘的聚类算法研究
文本挖掘
K-means
K-medoids
准确率
召回率
基于文本挖掘的聚类算法研究
文本挖掘
K-means
K-medoids
准确率
召回率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于FVSM的核聚类算法在文本聚类中的应用
来源期刊 长江大学学报(自然科学版)理工卷 学科 工学
关键词 模糊向量空间模型 文本聚类 核聚类算法
年,卷(期) 2010,(1) 所属期刊栏目 计算机科学与电子信息工程
研究方向 页码范围 72-75
页数 分类号 TP391
字数 3563字 语种 中文
DOI 10.3969/j.issn.1673-1409-C.2010.01.019
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 许少华 大庆石油学院计算机与信息技术学院 68 929 15.0 27.0
2 杨延锟 大庆石油学院计算机与信息技术学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (26)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
模糊向量空间模型
文本聚类
核聚类算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
长江大学学报(自科版)
双月刊
1673-1409
42-1741/N
湖北省荆州市南环路1号
chi
出版文献量(篇)
8185
总下载数(次)
23
总被引数(次)
21470
相关基金
黑龙江省自然科学基金
英文译名:
官方网址:http://jj.dragon.cn/zr/index.asp
项目类型:
学科类型:
论文1v1指导