基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网页自动分类是当前互联网搜索领域一个热点研究课题,目前主要有基于网页文本内容的分类和基于网页间超链接结构的分类.但是这些分类都只利用了网页的信息,没有考虑到网页所在网站提供的信息.文中提出了一种全新的对网站内部拓扑结构进行简约的算法,提取网站隐含的层次结构,生成层次结构树,从而达到对网站内部网页实现多层次分类的目的,并且已经成功应用到电子商务智能搜索和挖掘系统中.
推荐文章
基于网页结构的网站无障碍抽样方法
网站可达性
网站测试
网页结构
网页评估
采样方法
网页抽样
基于网页可达性和访问率的电子超市网站链接结构优化方法
网页可达性
网页访问率
电子超市网站
链接结构优化
禁忌搜索
基于正文结构和长句提取的网页去重算法
网页去重
正文结构树
长句提取
层次指纹
面向分类的网页主题特征提取
网页分类
主题特征
主题相关性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于提取网站层次结构的网页分类方法
来源期刊 计算机应用 学科 工学
关键词 网页分类 网站层次结构 URL聚类
年,卷(期) 2006,(5) 所属期刊栏目 网络与通信
研究方向 页码范围 1134-1136
页数 3页 分类号 TP393.02
字数 2587字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 彭宏 华南理工大学计算机科学与工程学院 188 2058 24.0 34.0
2 郑启伦 华南理工大学计算机科学与工程学院 103 1003 17.0 26.0
3 邓健爽 华南理工大学计算机科学与工程学院 6 64 6.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (14)
同被引文献  (23)
二级引证文献  (9)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(3)
  • 引证文献(3)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(3)
  • 引证文献(2)
  • 二级引证文献(1)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(3)
  • 引证文献(1)
  • 二级引证文献(2)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
网页分类
网站层次结构
URL聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导