基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着经济与信息技术的发展,在许多应用中均产生大量数据.然而,受硬件设备、人工操作、多源数据集成等诸多因素的影响,在这些应用之中往往存在较为严重的数据质量问题,特别是不一致性问题,从而无法有效管理数据.因此,首要的任务就是开发新型数据清洗技术来提升数据质量,以支持后续的数据管理与分析.现有工作主要研究基于函数依赖的数据修复技术,即以函数依赖来描述数据一致性约束,通过变更数据库中部分元组的属性值(而非增加/删除元组)来使得整个数据库遵循函数依赖集合.从一致性约束描述的角度来看,函数依赖并非是唯一的表达方式,还存在其他表达方式,例如硬约束、数量约束、等值约束、非等值约束等.然而,随着一致性约束种类的增加,其处理难度也远比仅有函数依赖的场景要困难.考虑以函数依赖与其他一致性约束共同表述数据库的一致性约束,并在此基础上设计数据修复算法,从而提升数据质量.实验结果表明,所提方法的执行效率较高.
推荐文章
基于关联规则的条件函数依赖发现及数据修复
关联规则
条件函数依赖
一致性
数据修复
大数据
缺失数据
基于内容感知发现XML条件函数依赖
可扩展标记语言
条件函数依赖
语义约束
内容感知
数据一致性
基于条件函数依赖的隐私保护模型
隐私保护
数据发布
条件函数依赖
l-deduction
信息损失
基于关联规则的条件函数依赖发现及数据修复
关联规则
条件函数依赖
一致性
数据修复
大数据
缺失数据
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于函数依赖与条件约束的数据修复方法
来源期刊 软件学报 学科 工学
关键词 数据质量 数据修复 函数依赖 条件约束 等价类
年,卷(期) 2016,(7) 所属期刊栏目 大数据可用性理论、方法和技术专题
研究方向 页码范围 1671-1684
页数 14页 分类号 TP311
字数 13540字 语种 中文
DOI 10.13328/j.cnki.jos.005037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周傲英 华东师范大学计算机科学与软件工程学院数据科学与工程研究院 68 2290 20.0 47.0
2 金澈清 华东师范大学计算机科学与软件工程学院数据科学与工程研究院 39 1646 13.0 39.0
3 刘辉平 华东师范大学计算机科学与软件工程学院数据科学与工程研究院 5 28 2.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (65)
共引文献  (341)
参考文献  (5)
节点文献
引证文献  (13)
同被引文献  (57)
二级引证文献  (13)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1969(2)
  • 参考文献(0)
  • 二级参考文献(2)
1970(2)
  • 参考文献(0)
  • 二级参考文献(2)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(2)
  • 参考文献(0)
  • 二级参考文献(2)
1985(2)
  • 参考文献(0)
  • 二级参考文献(2)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(6)
  • 参考文献(1)
  • 二级参考文献(5)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(7)
  • 参考文献(1)
  • 二级参考文献(6)
2011(11)
  • 参考文献(0)
  • 二级参考文献(11)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(5)
  • 引证文献(4)
  • 二级引证文献(1)
2018(5)
  • 引证文献(4)
  • 二级引证文献(1)
2019(10)
  • 引证文献(4)
  • 二级引证文献(6)
2020(6)
  • 引证文献(1)
  • 二级引证文献(5)
研究主题发展历程
节点文献
数据质量
数据修复
函数依赖
条件约束
等价类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导