基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网上存在着大量可访问的Web数据库,不同web数据库之间存在着内容上的重叠.来自不同web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep web数据集成中数据合并过程里一个必不可少的环节,而且是一个很具有挑战性的工作.对该问题进行了深入的探讨,提出了一种新颖的方法自动完成实体识别,该方法克服了传统的实体识别工作以模式匹配为前提的弊端,并且与领域无关.实验表明,该方法在Deep web环境下可以达到相当高的准确性.
推荐文章
Deep Web数据集成系统中的查询效率优化
Deep
Web
统一查询接口
查询效率
基于移动Agent的Deep Web数据集成研究
Deep Web
数据集成
移动Agent
反馈
Deep Web集成系统中同类主题数据源选择方法
差异性分析
Deep Web
数据源选择
质量评估模型
数据ETL过程中的实体识别方法
数据ETL
相似重复记录
实体识别算法
实体识别过程框架
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Deep Web数据集成中的实体识别方法
来源期刊 计算机研究与发展 学科 工学
关键词 Deep web web数据库 实体识别 数据合并
年,卷(期) 2006,(z3) 所属期刊栏目 Web与数据库
研究方向 页码范围 46-53
页数 8页 分类号 TP391
字数 8014字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘伟 中国人民大学信息学院 277 1964 21.0 39.0
2 孟小峰 中国人民大学信息学院 135 6213 41.0 77.0
3 艾静 中国人民大学信息学院 6 81 3.0 6.0
4 凌妍妍 中国人民大学信息学院 3 173 3.0 3.0
5 王仲远 中国人民大学信息学院 5 126 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (49)
同被引文献  (17)
二级引证文献  (95)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(16)
  • 引证文献(10)
  • 二级引证文献(6)
2009(17)
  • 引证文献(5)
  • 二级引证文献(12)
2010(16)
  • 引证文献(6)
  • 二级引证文献(10)
2011(14)
  • 引证文献(6)
  • 二级引证文献(8)
2012(21)
  • 引证文献(7)
  • 二级引证文献(14)
2013(17)
  • 引证文献(4)
  • 二级引证文献(13)
2014(6)
  • 引证文献(1)
  • 二级引证文献(5)
2015(10)
  • 引证文献(5)
  • 二级引证文献(5)
2016(4)
  • 引证文献(0)
  • 二级引证文献(4)
2017(12)
  • 引证文献(3)
  • 二级引证文献(9)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(6)
  • 引证文献(0)
  • 二级引证文献(6)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Deep
web
web数据库
实体识别
数据合并
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
总被引数(次)
164870
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家重点基础研究发展计划(973计划)
英文译名:National Basic Research Program of China
官方网址:http://www.973.gov.cn/
项目类型:
学科类型:农业
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导