基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种将支持向量机与无监督聚类相结合的新分类算法,给出了一种新的网页表示方法并应用于网页分类问题.该算法首先利用无监督聚类分别对训练集中正例和反例聚类,然后挑选一些例子训练SVM并获得SVM分类器.任何网页可以通过比较其与聚类中心的距离决定采用无监督聚类方法或SVM分类器进行分类.该算法充分利用了SVM准确率高与无监督聚类速度快的优点.实验表明它不仅具有较高的训练效率,而且有很高的精确度.
推荐文章
基于决策支持向量机的中文网页分类器
支持向量机
决策树
网页
分类
基于支持向量机的中文网页自动分类
支持向量机
统计学习
优化
网页
文本分类
基于KNN及相关链接的中文网页分类研究
中文网页分类
网页提取
相关链接
KNN
中文网页分类技术解析
文本信息
网页分类
向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于支持向量机与无监督聚类相结合的中文网页分类器
来源期刊 计算机学报 学科 工学
关键词 支持向量机 聚类 网页分类
年,卷(期) 2001,(1) 所属期刊栏目
研究方向 页码范围 62-68
页数 7页 分类号 TP391
字数 6798字 语种 中文
DOI 10.3321/j.issn:0254-4164.2001.01.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 史忠植 中国科学院计算技术研究所 232 9166 52.0 89.0
2 李晓黎 中国科学院计算技术研究所 5 706 5.0 5.0
3 刘继敏 中国科学院计算技术研究所 4 659 4.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (346)
同被引文献  (120)
二级引证文献  (1515)
2001(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2001(1)
  • 引证文献(1)
  • 二级引证文献(0)
2002(8)
  • 引证文献(8)
  • 二级引证文献(0)
2003(20)
  • 引证文献(18)
  • 二级引证文献(2)
2004(45)
  • 引证文献(31)
  • 二级引证文献(14)
2005(93)
  • 引证文献(29)
  • 二级引证文献(64)
2006(152)
  • 引证文献(39)
  • 二级引证文献(113)
2007(177)
  • 引证文献(34)
  • 二级引证文献(143)
2008(188)
  • 引证文献(28)
  • 二级引证文献(160)
2009(164)
  • 引证文献(32)
  • 二级引证文献(132)
2010(135)
  • 引证文献(23)
  • 二级引证文献(112)
2011(122)
  • 引证文献(18)
  • 二级引证文献(104)
2012(101)
  • 引证文献(13)
  • 二级引证文献(88)
2013(104)
  • 引证文献(12)
  • 二级引证文献(92)
2014(99)
  • 引证文献(13)
  • 二级引证文献(86)
2015(93)
  • 引证文献(11)
  • 二级引证文献(82)
2016(95)
  • 引证文献(10)
  • 二级引证文献(85)
2017(107)
  • 引证文献(12)
  • 二级引证文献(95)
2018(77)
  • 引证文献(7)
  • 二级引证文献(70)
2019(62)
  • 引证文献(4)
  • 二级引证文献(58)
2020(17)
  • 引证文献(3)
  • 二级引证文献(14)
研究主题发展历程
节点文献
支持向量机
聚类
网页分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
总被引数(次)
187004
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导