基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
采用对不一致数据上的修复以及将记录上的属性值用概率表示来解决不一致数据库中相似重复记录的识别。目前对重复记录识别的研究都是直接对不一致数据进行比较的。利用完整性约束对数据进行修复的概念,找到不一致的分量,发现在其上的其余可能值,充分考虑字段之间的语义关系;利用LIMBO概率模型,用数值型概率表示分类数据,克服记录不便于计算的缺点。
推荐文章
关系数据库中近似重复记录的识别
数据清理
重复记录识别
字符串匹配
数据仓库
对基于MPN的相似重复记录识别算法的改进
数据清理
相似重复记录
字符串匹配
MPN
传递闭包
时态RDF数据的不一致性修复和预处理
时态数据模型
有效时间
时态数据的不一致性
变化操作
一种基于VSM的检测相似重复记录的方法
空间向量模型
聚类
相似重复记录
权重
优先队列
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合修复代价的不一致关系数据中相似重复记录识别
来源期刊 现代计算机:中旬刊 学科 工学
关键词 重复记录识别 概率 完整性约束
年,卷(期) 2015,(6) 所属期刊栏目
研究方向 页码范围 3-9
页数 7页 分类号 TP311.13
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴爱华 上海海事大学信息工程学院 25 91 6.0 8.0
2 曾卫明 上海海事大学信息工程学院 33 65 4.0 6.0
3 沈忱 上海海事大学信息工程学院 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (68)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2009(8)
  • 参考文献(8)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
重复记录识别
概率
完整性约束
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代计算机:中旬刊
月刊
1007-1423
44-1415/TP
广州市海珠区新港西路135号中山大学园B
46-205
出版文献量(篇)
9067
总下载数(次)
3
总被引数(次)
0
论文1v1指导