基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
WWW上的信息极大丰富,如何从巨量的信息中有效地发现有用的信息,是亟待解决的问题,而Web网页的正确分类正是其中的核心问题.针对超文本结构中的结构特征,提出了用Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息进行分类的方法.经实验验证,与只用单种方法对超文本进行分类的方法相比,综合分类法有效地提高了分类的正确率.
推荐文章
基于Bayes算法的网页文本分类研究
文本自动分类
分类算法
特征抽取
中文网页作者情感态度倾向性分类研究
褒贬倾向性分类
KNN
Naive Bayes
基于RSOM-Bayes的网页分类方法
网页分类
RSOM神经网络树
Bayes方法
向量空间模型
基于Bayes网的软件构件分类
软件构件
Naive-Bayes网
分类器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 用Naive Bayes方法协调分类Web网页
来源期刊 软件学报 学科 工学
关键词 超文本 Web 分类 机器学习 互联网 数据挖掘 信息检索 WWW
年,卷(期) 2001,(9) 所属期刊栏目
研究方向 页码范围 1386-1392
页数 7页 分类号 TP181
字数 3838字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蔡庆生 中国科学技术大学计算机科学与技术系 115 2706 28.0 47.0
2 郑诚 中国科学技术大学计算机科学与技术系 13 200 5.0 13.0
6 王清毅 中国科学技术大学计算机科学与技术系 9 436 8.0 9.0
7 刘洁 中国科学技术大学计算机科学与技术系 47 612 10.0 24.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (151)
同被引文献  (58)
二级引证文献  (1068)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2002(3)
  • 引证文献(3)
  • 二级引证文献(0)
2003(7)
  • 引证文献(7)
  • 二级引证文献(0)
2004(25)
  • 引证文献(15)
  • 二级引证文献(10)
2005(29)
  • 引证文献(9)
  • 二级引证文献(20)
2006(71)
  • 引证文献(13)
  • 二级引证文献(58)
2007(101)
  • 引证文献(19)
  • 二级引证文献(82)
2008(108)
  • 引证文献(17)
  • 二级引证文献(91)
2009(83)
  • 引证文献(9)
  • 二级引证文献(74)
2010(136)
  • 引证文献(18)
  • 二级引证文献(118)
2011(101)
  • 引证文献(16)
  • 二级引证文献(85)
2012(88)
  • 引证文献(7)
  • 二级引证文献(81)
2013(77)
  • 引证文献(4)
  • 二级引证文献(73)
2014(83)
  • 引证文献(3)
  • 二级引证文献(80)
2015(70)
  • 引证文献(4)
  • 二级引证文献(66)
2016(76)
  • 引证文献(1)
  • 二级引证文献(75)
2017(59)
  • 引证文献(3)
  • 二级引证文献(56)
2018(52)
  • 引证文献(0)
  • 二级引证文献(52)
2019(40)
  • 引证文献(1)
  • 二级引证文献(39)
2020(8)
  • 引证文献(1)
  • 二级引证文献(7)
研究主题发展历程
节点文献
超文本
Web
分类
机器学习
互联网
数据挖掘
信息检索
WWW
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导