作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
以网上书店为例,基于所发现的DeepWeb数据源,针对其查询接口,提出了一种基于领域知识的DeepWeb接口抽取方法,该方法采用正则表达式的规则提取查询接口,包括与控件相邻的文本语义词汇的提取和控件的提取,然而部分查询接口抽取出的文本语义信息比较繁琐,需借助页面中的字体颜色等特征,过滤非需要的信息,达到文中的目标。该方法获得了较好的结果,具有良好的可行性和实用性。
推荐文章
Deep web接口查询能力估计
查询接口
查询能力
基于演化版本的 Deep Web 查询接口维护方法
Deep Web
查询接口
演化版本
接口维护
面向旅游领域的Deep Web接口查询研究
Deep Web
接口查询
领域实例
基于查询接口特征的Deep Web数据源自动分类
Deep Web
自动分类
机器学习
数据集成
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于规则的Deep Web查询接口的抽取
来源期刊 电脑知识与技术:学术交流 学科 工学
关键词 领域知识 正则表达式 规则 查询接口抽取
年,卷(期) 2010,(1) 所属期刊栏目
研究方向 页码范围 7-8
页数 2页 分类号 TP311
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨丽华 河北大学数学与计算机学院 6 18 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
领域知识
正则表达式
规则
查询接口抽取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术:学术版
旬刊
1009-3044
34-1205/TP
安徽合肥市濉溪路333号
26-188
出版文献量(篇)
41621
总下载数(次)
23
总被引数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导