基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对在Deep Web数据库查询结果存在上限k的情况下,对于如何提取数据记录的问题,提出一种基于范围型属性的数据提取方法.利用范围型属性的值域特征,将其值域按照目标数据库的分布样本划分为多个子区间.实验结果表明,按照该方法划分的子区间,使得查询收益,查询饱和度和已提取数据的覆盖程度等指标均达到98.50%以上.
推荐文章
一种Deep Web数据源质量评估模型
DeepWeb
Web数据库
Web服务器
质量
一种Deep Web聚焦爬虫爬行策略
结构化Deep Web数据源
聚焦爬虫
决策树分类器
基于启发式信息的Deep Web结果模式获取方法
Deep Web
结果模式
网页数据特征矩阵
启发式信息
基于演化版本的 Deep Web 查询接口维护方法
Deep Web
查询接口
演化版本
接口维护
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于范围型属性的Deep Web数据提取方法
来源期刊 计算机应用与软件 学科 工学
关键词 数据提取 Deep Web 区间划 Top-k元组 范围型属性
年,卷(期) 2013,(2) 所属期刊栏目 基金项目论文
研究方向 页码范围 54-57
页数 4页 分类号 TP3
字数 3900字 语种 中文
DOI 10.3969/j.issn.1000-386x.2013.02.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈明 55 267 10.0 13.0
3 郭建兵 3 21 2.0 3.0
9 崔志明 1 4 1.0 1.0
10 赵朋朋 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (31)
参考文献  (3)
节点文献
引证文献  (4)
同被引文献  (14)
二级引证文献  (1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据提取
Deep Web
区间划
Top-k元组
范围型属性
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导