基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
WEB文本自动分类在很多方面都有着重要的应用,如信息检索,新闻分类等.决策树算法是一种简单并且广泛使用的分类方法,具有很多优点如:分类精度高,分类速度快等.主要研究了运用C4.5决策树构建Web页面分类器的基本方法和过程,并提出了一个基于C4.5决策树的Web页面分类器的框架.在此基础上实现了一个运用于网络爬虫的Web页面分类器,实验结果表明该算法是非常有效的.
推荐文章
基于C4.5决策树的视频车辆车型分类算法
C4.5决策树
层次化分类器
车型分类
一种基于变精度粗糙集的C4.5决策树改进算法
数据挖掘
决策树
信息增益率
C4.5算法
粗糙集
变精度粗糙集
近似分类质量
基于决策树C4.5集成算法的图像自动标注
C4.5算法
集成学习
修正矩阵
图像标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于C4.5决策树的Web页面分类算法
来源期刊 计算机系统应用 学科 工学
关键词 WEB文本分类 C4.5决策树 信息论 信息增益率 网络爬虫
年,卷(期) 2010,(10) 所属期刊栏目
研究方向 页码范围 195-198
页数 分类号 TP3
字数 2978字 语种 中文
DOI 10.3969/j.issn.1003-3254.2010.10.041
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曹薇 武汉职业技术学院计算机学院 21 126 6.0 11.0
2 张乃洲 湖北大学知行学院 7 92 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (37)
共引文献  (310)
参考文献  (4)
节点文献
引证文献  (17)
同被引文献  (20)
二级引证文献  (21)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(9)
  • 参考文献(0)
  • 二级参考文献(9)
2004(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(10)
  • 参考文献(0)
  • 二级参考文献(10)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(4)
  • 引证文献(4)
  • 二级引证文献(0)
2012(4)
  • 引证文献(4)
  • 二级引证文献(0)
2014(4)
  • 引证文献(4)
  • 二级引证文献(0)
2015(9)
  • 引证文献(3)
  • 二级引证文献(6)
2016(6)
  • 引证文献(1)
  • 二级引证文献(5)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(6)
  • 引证文献(1)
  • 二级引证文献(5)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
WEB文本分类
C4.5决策树
信息论
信息增益率
网络爬虫
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
论文1v1指导