基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了基于页面Block对Web页面的采集和存储方式,并详细表述了该方法如何完成基于布局页面分区、Block主题的抽取、版本和差异的比较以及增量存储的方式.实现了一个Web归档原型系统,并对所提出的算法进行了详细的测试.理论和实验表明,所提出的基于页面Block的Web档案(Web archive)采集和存储方法能够很好地适应Web档案的管理方式,并对基于Web档案的查询、搜索、知识发现和数据挖掘等应用提供有利的数据资源.
推荐文章
Web页面设计探索
Web
Web页面设计
设计原则
基于Web页面的动态模糊查询方法
Web
Oracle数据库
WebServer
模糊查询
基于BP神经网络的Web页面分类算法
分类技术
信息检索
Web页面
基于关键字的Web页面摘要生成技术
引导关键字
Web页面
摘要
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于页面Block的Web档案采集和存储
来源期刊 软件学报 学科 工学
关键词 Web档案 页面分区 页块
年,卷(期) 2008,(2) 所属期刊栏目 Deep Web数据集成
研究方向 页码范围 275-290
页数 16页 分类号 TP393
字数 9756字 语种 中文
DOI 10.3724/SP.J.1001.2008.00275
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王大玲 东北大学信息科学与工程学院 70 1479 23.0 36.0
2 申德荣 东北大学信息科学与工程学院 111 1289 18.0 32.0
3 宋杰 东北大学信息科学与工程学院 39 690 14.0 25.0
4 鲍玉斌 东北大学信息科学与工程学院 85 1496 22.0 36.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (24)
参考文献  (3)
节点文献
引证文献  (37)
同被引文献  (53)
二级引证文献  (21)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2008(2)
  • 引证文献(2)
  • 二级引证文献(0)
2009(4)
  • 引证文献(4)
  • 二级引证文献(0)
2010(10)
  • 引证文献(7)
  • 二级引证文献(3)
2011(6)
  • 引证文献(4)
  • 二级引证文献(2)
2012(10)
  • 引证文献(9)
  • 二级引证文献(1)
2013(3)
  • 引证文献(2)
  • 二级引证文献(1)
2014(4)
  • 引证文献(3)
  • 二级引证文献(1)
2015(3)
  • 引证文献(1)
  • 二级引证文献(2)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(10)
  • 引证文献(3)
  • 二级引证文献(7)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Web档案
页面分区
页块
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导