基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-EIM),能够有效解决Deep Web数据集成中数据纠错、消重及整合等问题.SS-EIM主要由文本匹配模型、语义分析模型和分组统计模型组成,采用文本粗略匹配、表象关联关系获取以及分组统计分析的三段式逐步求精策略,基于文本特征、语义信息及约束规则来不断精化识别结果;根据可获取的有限的实例信息,采用静态分析、动态协调相结合的自适应知识维护策略,构建和完善表象关联知识库,以适应Web数据的动态性并保证表象关联知识的完备性.通过实验验证了SS-EIM中所采用的关键技术的可行性和有效性.
推荐文章
一种Deep Web聚焦爬虫爬行策略
结构化Deep Web数据源
聚焦爬虫
决策树分类器
一种采用统计分析的入侵检测原型系统
入侵检测
统计分析
网络安全
基于智能语义自相关特征的数据库实体识别查询
语义
数据库
自相关特征
查询
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于语义及统计分析的Deep Web实体识别机制
来源期刊 软件学报 学科 工学
关键词 deep Web 数据集成 实体识别 数据消重 表象整合
年,卷(期) 2008,(2) 所属期刊栏目 Deep Web数据集成
研究方向 页码范围 194-208
页数 15页 分类号 TP393
字数 14425字 语种 中文
DOI 10.3724/SP.J.1001.2008.00194
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 申德荣 东北大学信息科学与工程学院 111 1289 18.0 32.0
2 寇月 东北大学信息科学与工程学院 68 816 12.0 26.0
3 聂铁铮 东北大学信息科学与工程学院 69 854 13.0 27.0
4 李冬 东软集团有限公司商用软件事业部 1 70 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (247)
参考文献  (7)
节点文献
引证文献  (70)
同被引文献  (46)
二级引证文献  (120)
1980(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(3)
  • 参考文献(3)
  • 二级参考文献(0)
2008(6)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(6)
  • 二级引证文献(0)
2008(6)
  • 引证文献(6)
  • 二级引证文献(0)
2009(11)
  • 引证文献(11)
  • 二级引证文献(0)
2010(10)
  • 引证文献(8)
  • 二级引证文献(2)
2011(7)
  • 引证文献(6)
  • 二级引证文献(1)
2012(18)
  • 引证文献(12)
  • 二级引证文献(6)
2013(20)
  • 引证文献(10)
  • 二级引证文献(10)
2014(7)
  • 引证文献(3)
  • 二级引证文献(4)
2015(13)
  • 引证文献(4)
  • 二级引证文献(9)
2016(6)
  • 引证文献(1)
  • 二级引证文献(5)
2017(13)
  • 引证文献(5)
  • 二级引证文献(8)
2018(28)
  • 引证文献(1)
  • 二级引证文献(27)
2019(34)
  • 引证文献(2)
  • 二级引证文献(32)
2020(17)
  • 引证文献(1)
  • 二级引证文献(16)
研究主题发展历程
节点文献
deep Web
数据集成
实体识别
数据消重
表象整合
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导