基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统搜索引擎仅可以索引浅层Web页面,然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面.由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口.文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性.
推荐文章
Deep web接口查询能力估计
查询接口
查询能力
基于查询接口特征的Deep Web数据源自动分类
Deep Web
自动分类
机器学习
数据集成
面向旅游领域的Deep Web接口查询研究
Deep Web
接口查询
领域实例
基于演化版本的 Deep Web 查询接口维护方法
Deep Web
查询接口
演化版本
接口维护
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Deep Web查询接口的自动判定
来源期刊 计算机技术与发展 学科 工学
关键词 深网 网页表单 特征提取 朴素贝叶斯分类
年,卷(期) 2007,(5) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 148-151
页数 4页 分类号 TP181
字数 4431字 语种 中文
DOI 10.3969/j.issn.1673-629X.2007.05.044
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 崔志明 苏州大学智能信息处理及应用研究所 169 2304 25.0 38.0
2 赵朋朋 苏州大学智能信息处理及应用研究所 39 426 11.0 19.0
3 高岭 苏州大学智能信息处理及应用研究所 3 121 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (46)
同被引文献  (13)
二级引证文献  (46)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(6)
  • 引证文献(6)
  • 二级引证文献(0)
2009(10)
  • 引证文献(8)
  • 二级引证文献(2)
2010(13)
  • 引证文献(11)
  • 二级引证文献(2)
2011(22)
  • 引证文献(7)
  • 二级引证文献(15)
2012(12)
  • 引证文献(3)
  • 二级引证文献(9)
2013(9)
  • 引证文献(4)
  • 二级引证文献(5)
2014(7)
  • 引证文献(3)
  • 二级引证文献(4)
2015(5)
  • 引证文献(2)
  • 二级引证文献(3)
2016(5)
  • 引证文献(1)
  • 二级引证文献(4)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
深网
网页表单
特征提取
朴素贝叶斯分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导