基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
根据Deep Web数量的爆炸性增长特点,提出一种基于查询接口文本的Deep Web数据源分类算法,对于分类的查询接口,采用2种方法:基于向量空间的TF-IDF方法和基于知网的语义相似度方法.综合2种方法获得接口之间的相似度.借鉴K-NN算法,提出WDB分类算法,从而实现Deep Web数据源的分类.实验结果表明,该算法在熵和F-measure 2种评价标准上均能获得较高质量,具有一定实用价值.
推荐文章
基于查询接口特征的Deep Web数据源自动分类
Deep Web
自动分类
机器学习
数据集成
Deep web接口查询能力估计
查询接口
查询能力
Deep Web数据源自动分类
Deep Web
查询接口
朴素贝叶斯分类
基于演化版本的 Deep Web 查询接口维护方法
Deep Web
查询接口
演化版本
接口维护
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于查询接口文本的Deep Web数据源分类
来源期刊 计算机工程 学科 工学
关键词 深层网 数据源分类 知网 K-NN算法 语义分类
年,卷(期) 2010,(12) 所属期刊栏目 软件技术与数据库
研究方向 页码范围 66-68
页数 分类号 TP311.52
字数 2883字 语种 中文
DOI 10.3969/j.issn.1000-3428.2010.12.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 伏玉琛 苏州大学计算机科学与技术学院 35 201 8.0 11.0
2 周小科 苏州大学计算机科学与技术学院 17 38 3.0 6.0
3 华慧 苏州大学计算机科学与技术学院 1 5 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (24)
参考文献  (2)
节点文献
引证文献  (5)
同被引文献  (3)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深层网
数据源分类
知网
K-NN算法
语义分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导