作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网页内容采集主要是指把某一网站的整站网页内容或部分网页内容批量抓取到自己网站的一种技术手段,非法的网页内容采集,不仅使版权信息不能得到有效保护,而且,在批量采集时,尤其是含多媒体元素和软件的页面被采集时,会导致网站所在服务器负荷增大,正常用户的浏览速度下降.
推荐文章
Linux网页防篡改机制的研究与实现
网页防篡改
Apache
Linux
LKM(Linux可加载内核模块)
基于内容的中文网页自动分类研究
自动分类
信息检索
全球网
基于布局相似性的网页正文内容提取研究
布局相似性
网页正文提取
信息检索
基于内容与链接特征的中文垃圾网页分类
网页作弊
搜索引擎
机器学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网页内容防采集策略的研究
来源期刊 数字技术与应用 学科 社会科学
关键词 网站 网页内容 采集
年,卷(期) 2010,(5) 所属期刊栏目 学术论坛
研究方向 页码范围 144
页数 分类号 G203
字数 2325字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张宝政 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网站
网页内容
采集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数字技术与应用
月刊
1007-9416
12-1369/TN
16开
天津市
6-251
1983
chi
出版文献量(篇)
20434
总下载数(次)
106
总被引数(次)
35701
论文1v1指导