基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
研究网页自动分类是为快速找到用户所需网页.由于网络中网页数量相当大,而且网络是一种半结构化、海量、高维等文本,传统文本分类方法无法进行降维和消除冗余信息,易出现维数灾问题,网页分类准确率低,用户很难找到自己所需网页.为了提高网页分类准确率,提出基于主成分支持向量机的网页自动分类方法.首先对网页数据进行预处理,提取网页特征向量向量,消除冗余信息,然后采用主成分分析对网页特征向量进行降维处理,然后采用支持向量机对网页进行自动分类.对网页数据集进行仿真,结果表明,网页分类准确率达95%以上,网页分类速度较加,说明主成分支持向量机是一种有效的网页分类方法.
推荐文章
基于内容的中文网页自动分类研究
自动分类
信息检索
全球网
一个网页自动分类系统的设计
网页分类
简单贝叶斯
信息增益
监督学习
一种自动分类的网页搜索排序算法
领域向量
BM25
softmax回归分类
网页排序
基于链接的Web网页分类
链接挖掘
基于链接的分类
逻辑回归模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网页自动分类的建模与仿真研究
来源期刊 计算机仿真 学科 工学
关键词 网页分类 主成分分析 支持向量机 数据挖掘
年,卷(期) 2011,(10) 所属期刊栏目 网络与互联技术
研究方向 页码范围 121-124,252
页数 分类号 TP391
字数 3926字 语种 中文
DOI 10.3969/j.issn.1006-9348.2011.10.030
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李爽 23 98 5.0 9.0
2 周序生 31 96 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (146)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (11)
二级引证文献  (0)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(5)
  • 参考文献(1)
  • 二级参考文献(4)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网页分类
主成分分析
支持向量机
数据挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机仿真
月刊
1006-9348
11-3724/TP
大16开
北京海淀阜成路14号
82-773
1984
chi
出版文献量(篇)
20896
总下载数(次)
43
论文1v1指导