基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
当前基于网页的抓取技术只是简单地获取整个页面的HTML文件并抽取所需的文本信息,而对于其它MIME对象,如图片,特别是通过ASP、JSP或Servlet等服务器端组件查询后返回的图片对象,则很难获取.为了解决这个问题,提出了一种基于Internet Explorer缓存的Web图片获取方法:在VisualC++中采用多线程技术构造一个浏览器对象,将选定的样本图片页面在浏览器对象中打开,然后在IE缓存中搜索并获取所需的Web图片,最后将它存入Oracle数据库中分析使用.这种方法的优点是能够方便、快捷的获取任何来源形式的Web图片对象.
推荐文章
一种基于DHT的Web缓存共享方法
分布式哈希表
Web缓存
命中率
系统响应
一种不良图片快速过滤方法
图片过滤
混合肤色模型
人脸检测
特征判断
一种基于分布约简的规则获取方法
粗糙集
分布约简
分布核
规则获取
一种改进的规则获取方法
粗糙集
约简
属性重要度和依赖度
规则获取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于IE缓存的Web图片获取方法
来源期刊 计算机系统应用 学科
关键词 IE缓存 图片获取 多线程 线程同步 事件
年,卷(期) 2009,(12) 所属期刊栏目 实践经验
研究方向 页码范围 208-211
页数 4页 分类号
字数 2773字 语种 中文
DOI 10.3969/j.issn.1003-3254.2009.12.049
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姚耀文 华南理工大学计算机科学与工程学院 25 367 8.0 19.0
2 欧永红 华南理工大学计算机科学与工程学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (39)
参考文献  (3)
节点文献
引证文献  (3)
同被引文献  (2)
二级引证文献  (3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
IE缓存
图片获取
多线程
线程同步
事件
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导