基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了改善文本聚类的准确度,提出用基于主题概念子空间的模糊c-均值聚类(TCS2FCM)方法来分类文本.采用5个评估函数的加权值来提取关键短语;利用WordNet(R)对相应的关键短语提取概念短语并生成最后的类别描述.初始中心和初始隶属度矩阵的建立是决定模糊c-均值聚类效果的关键,使用能够代表文本主题的概念短语来建立相互正交的主题概念子空间,利用主题子空间中的概念向量来初始化聚类中心和隶属度矩阵.实验结果表明:不同于传统模糊c-均值聚类的随机化初始,与文本内容相关的初始化有助于改进最后的聚类结果,提高聚类精度.
推荐文章
基于空间邻域加权的模糊C-均值聚类及其应用研究
图像聚类
模糊C-均值聚类
空间邻域
基于改进QPSO的模糊C-均值聚类算法
模糊C-均值聚类
量子粒子群优化
聚类分析
量子门更新策略
基于自适应权重的模糊C-均值聚类算法
模糊C-均值聚类算法
自适应权重
高斯距离
隶属矩阵
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于主题概念空间的文本模糊c-均值聚类方法
来源期刊 东南大学学报(英文版) 学科 工学
关键词 TCS2FCM 主题概念空间 模糊c-均值聚类 文本聚类
年,卷(期) 2007,(3) 所属期刊栏目
研究方向 页码范围 439-442
页数 4页 分类号 TP391
字数 593字 语种 英文
DOI 10.3969/j.issn.1003-7985.2007.03.028
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (31)
参考文献  (5)
节点文献
引证文献  (5)
同被引文献  (8)
二级引证文献  (9)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1966(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(2)
  • 二级参考文献(1)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(2)
  • 引证文献(1)
  • 二级引证文献(1)
2010(2)
  • 引证文献(0)
  • 二级引证文献(2)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(2)
  • 引证文献(1)
  • 二级引证文献(1)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
TCS2FCM
主题概念空间
模糊c-均值聚类
文本聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
东南大学学报(英文版)
季刊
1003-7985
32-1325/N
大16开
南京四牌楼2号
1984
eng
出版文献量(篇)
2004
总下载数(次)
1
总被引数(次)
8843
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导