原文服务方: 计算机应用研究       
摘要:
Deep Web结果页面大多由网站根据请求从后台数据库读取数据并动态填充到通用模板而生成的.研究如何从一系列同模板生成的页面中生成该模板,并利用模板自动抽取数据.给出了模板生成问题的形式化描述,提出了一种新颖的模板生成方法,利用生成的模板从实例网页中抽取数据.与现有方法相比,该方法适用于列表页面和详细页面两种类型网页.通过在多个领域站点上实验,说明新方法在不降低准确率的情况下能大大提高召回率.
推荐文章
Deep Web数据源自动分类
Deep Web
查询接口
朴素贝叶斯分类
一种基于自动WEB数据抽取生成黄页的方法
行业黄页
WEB信息抽取
模式匹配
抽取规则
面向旅游领域的Deep Web接口查询研究
Deep Web
接口查询
领域实例
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向Deep Web数据自动抽取的模板生成方法
来源期刊 计算机应用研究 学科
关键词 Deep,Web 数据抽取 模板生成 文法推断
年,卷(期) 2010,(1) 所属期刊栏目 系统应用开发
研究方向 页码范围 200-203
页数 4页 分类号 TP311
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2010.01.059
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 鞠时光 江苏大学计算机学院 159 1685 21.0 34.0
2 王秀红 江苏大学计算机学院 29 139 6.0 11.0
3 杨晓琴 江苏大学计算机学院 3 13 3.0 3.0
4 曹庆皇 江苏大学计算机学院 3 13 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (5)
同被引文献  (9)
二级引证文献  (22)
1967(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(7)
  • 引证文献(2)
  • 二级引证文献(5)
2016(6)
  • 引证文献(0)
  • 二级引证文献(6)
2017(5)
  • 引证文献(0)
  • 二级引证文献(5)
2018(3)
  • 引证文献(0)
  • 二级引证文献(3)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Deep,Web
数据抽取
模板生成
文法推断
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导