作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着Internet的迅速发展,Web已经成为人们获取信息的主要渠道之一,大多数的企业或团体都是通过Web站点的网页发布企业信息。为了充分利用这些信息,而不仅仅是浏览,应用程序必须从HTML形式的Web网页中抽取感兴趣的数据,并转换成具有一定结构的格式化数据。Web包装器软件的任务就是负责抽取HTML格式的数据并转化为结构化的数据。基于Web包装器的应用程序能以访问数据库中信息的方式来访问Web数据,所以Web包装器是Web数据集成体系结构中的关键部分。论文在研究Web包装器概念设计的基础上,利用最新的Web技术、信息处理技术和人工智能技术,完成了Web网页数据抽取包装器软件的设计,并通过Web新书发布页面信息抽取实验,分析了算法和系统的性能,验证了该包装器软件的可行性和高效性。
推荐文章
面向不规则列表的网页数据抽取技术的研究
列表页
网页数据抽取
标签树匹配
部分树对齐
基于Web Service的数据抽取研究与设计
Web Service数据抽取
抽取线程
数据库
网页数据自动抽取系统
信息提取
包装器产生
DOM树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Web网页数据抽取软件的设计与实现
来源期刊 职业时空 学科 工学
关键词 WEB网页 数据抽取 概念设计 软件 Internet 获取信息 人工智能技术 信息处理技术
年,卷(期) zysk_2008,(10) 所属期刊栏目
研究方向 页码范围 245
页数 1页 分类号 TP393.092
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李宏伟 郑州轻工业学院机械工程学院 29 92 6.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
WEB网页
数据抽取
概念设计
软件
Internet
获取信息
人工智能技术
信息处理技术
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
职业时空
月刊
1672-8963
13-1349/C
河北省廊坊市爱民西道100号廊坊师范学院
出版文献量(篇)
13108
总下载数(次)
8
论文1v1指导