原文服务方: 计算机应用研究       
摘要:
传统的使用语料库对入口标签字符串进行匹配的方法受限于语料库的完整性和匹配算法的灵活性.为突破这种局限,引入了基于表单元件统计特征的Deep Web入口探测方法和使用文本分类方法对其进行分类的双层分类模型,并提出了两种特征权重计算方法用于特征选取.在TEL-8 Query Interfaces数据集上,测试结果体现了双层分类模型的优越性和特征向量维归约的必要性.
推荐文章
Deep Web数据源自动分类
Deep Web
查询接口
朴素贝叶斯分类
基于查询接口特征的Deep Web数据源自动分类
Deep Web
自动分类
机器学习
数据集成
面向旅游领域的Deep Web接口查询研究
Deep Web
接口查询
领域实例
基于演化版本的 Deep Web 查询接口维护方法
Deep Web
查询接口
演化版本
接口维护
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Deep Web入口探测与分类方法研究
来源期刊 计算机应用研究 学科
关键词 Deep Web 网络爬虫 结构特征 维归约 双层分类模型
年,卷(期) 2009,(12) 所属期刊栏目 网络与通信技术
研究方向 页码范围 4697-4700,4703
页数 5页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2009.12.083
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陆余良 解放军电子工程学院网络系 42 682 12.0 25.0
2 刘金红 解放军电子工程学院网络系 9 370 5.0 9.0
3 张亮 解放军电子工程学院网络系 13 120 5.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (8)
参考文献  (2)
节点文献
引证文献  (7)
同被引文献  (6)
二级引证文献  (3)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2013(4)
  • 引证文献(4)
  • 二级引证文献(0)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Deep Web
网络爬虫
结构特征
维归约
双层分类模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导