基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
有监督的分类方法是文本分类中常用的方法,它需要采用人工标识的样本进行训练,对样本的人工标识是一个比较繁锁的过程.无监督的分类方法没有这一过程,但其分类的效果往往不太好.针对两者各自的优缺点,利用一种基于SVM和K-means相结合的文本分类方法,首先用K-means方法进行文本聚类,然后选取每类中距离聚类中心较近的一些文本作为该类的训练样本训练SVM分类器,最后用训练好的SVM对文本进行分类.此方法避免了无监督方法分类效果不好的缺点,同时也省去了SVM方法中对样本进行人工标识的繁锁过程.基于灾害文本的实验结果也表明了这种新方法的可行性.
推荐文章
基于K-means与SVM结合的遥感图像全自动分类方法
K-means
支持向量机
遥感图像分类
结合双粒子群和K-means的混合文本聚类算法
双粒子群
自调整惯性权值
信息交流
K-means算法
文本聚类
文本分类中基于K-means的类偏斜KNN样本剪裁
K最近邻
类偏斜
样本剪裁
聚类
K-means聚类和支持向量机结合的文本分类研究
文本分类
k-means算法
聚类
支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 SVM和K-means结合的文本分类方法研究
来源期刊 计算机技术与发展 学科 工学
关键词 文本分类 K-means 支持向量机
年,卷(期) 2009,(11) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 35-37,41
页数 4页 分类号 TP181
字数 3689字 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (160)
参考文献  (8)
节点文献
引证文献  (24)
同被引文献  (20)
二级引证文献  (17)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(3)
  • 参考文献(1)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(6)
  • 参考文献(0)
  • 二级参考文献(6)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(5)
  • 参考文献(2)
  • 二级参考文献(3)
2008(3)
  • 参考文献(3)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(3)
  • 引证文献(2)
  • 二级引证文献(1)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2013(8)
  • 引证文献(2)
  • 二级引证文献(6)
2014(4)
  • 引证文献(2)
  • 二级引证文献(2)
2015(2)
  • 引证文献(0)
  • 二级引证文献(2)
2016(3)
  • 引证文献(2)
  • 二级引证文献(1)
2017(5)
  • 引证文献(3)
  • 二级引证文献(2)
2018(5)
  • 引证文献(5)
  • 二级引证文献(0)
2019(4)
  • 引证文献(3)
  • 二级引证文献(1)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
文本分类
K-means
支持向量机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
相关基金
国家科技支撑计划
英文译名:
官方网址:http://kjzc.jhgl.org/
项目类型:重大项目
学科类型:能源
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导