作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
WARC文件格式标准是由ISO国际标准化组织2009年发布的网络信息资源存档格式标准,是网络信息资源长期保存领域唯一的文件格式标准.目前已广泛应用在世界各国的数字图书馆、数字档案馆、数字资源仓储机构中. WARC标准解析 WARC文件主要构成要素是WARC资源记录,一个文件由若干个WARC资源记录构成,WARC记录间以两个空行分隔.WARC记录有多种类型,包括warcinfo、response、resource、request、metadata、revisit、conversion、continuation 8种,用于记录软件收割网页时的所有信息,包括访问请求、元数据等,尽可能完整地保存网络资源,而不仅仅是网页内容.WARC记录由记录头和内容块构成,中间以空行分隔.记录头由版本行和若干个warc命名字段及字段值构成.版本行说明遵循的WARC标准版本号,Warc命名字段值列表记录WARC记录的各种元数据,WARC1.1版本提供了21种WARC命名字段,用于描述记录块内容、获取过程、块间联系等.
推荐文章
反馈机制在P2P网络资源搜索中的应用研究
P2P网络
资源搜索
反馈机制
校园多媒体教学网络资源库设计、建设与应用研究
多媒体资源库
视频流格式
VOD视频点播
多媒体教学
数字设备和网络资源在“寓教于乐”课堂中的应用研究
寓教于乐
数字设备
网络资源
教学改革
网络资源描述和组织方法研究
网络资源
多维属性
描述模型
组织树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网络资源归档标准WARC及其应用研究
来源期刊 中国档案 学科
关键词
年,卷(期) 2020,(12) 所属期刊栏目 新思揽华
研究方向 页码范围 78
页数 1页 分类号
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
引文网络交叉学科
相关学者/机构
期刊影响力
中国档案
月刊
1007-5054
11-3357/G2
16开
北京市宣武区永安路106号
2-283
1951
chi
出版文献量(篇)
8534
总下载数(次)
5
总被引数(次)
19412
论文1v1指导