基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Web中包含着海量的高质量信息,它们通常处在网络深处,无法被传统搜索引擎索引,将这样的资源称为Deep Web.因为查询接口是Deep Web的唯一入口,所以要获取Deep Web信息就必须判定哪些网页表单是Deep Web查询接口.由于最大熵模型可以综合观察到的各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结果.因此,基于最大熵模型的分类性能,利用最大熵分类算法自动判定查询接口.并通过实验,将最大熵分类法与其它常用分类方法进行了比较,结果显示它的分类性能优于Bayes方法和C4.5方法,与SVM方法相当,表明这是一种非常实用的查询接口分类方法.
推荐文章
基于查询接口特征的Deep Web数据源自动分类
Deep Web
自动分类
机器学习
数据集成
Deep web接口查询能力估计
查询接口
查询能力
面向旅游领域的Deep Web接口查询研究
Deep Web
接口查询
领域实例
基于演化版本的 Deep Web 查询接口维护方法
Deep Web
查询接口
演化版本
接口维护
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于最大熵分类器的Deep Web查询接口自动判定
来源期刊 计算机工程与应用 学科 工学
关键词 Deep Web 网页表单 特征提取 最大熵模型
年,卷(期) 2008,(21) 所属期刊栏目 机器学习
研究方向 页码范围 133-137
页数 5页 分类号 TP18
字数 6281字 语种 中文
DOI 10.3778/j.issn.1002-8331.2008.21.037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 崔志明 169 2304 25.0 38.0
3 黄黎 4 19 3.0 4.0
5 方巍 15 153 8.0 12.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (129)
参考文献  (3)
节点文献
引证文献  (8)
同被引文献  (3)
二级引证文献  (1)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(4)
  • 引证文献(4)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Deep Web
网页表单
特征提取
最大熵模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导