基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
信息化时代数据海量增长的同时,用户需要利用多种指标从不同性质角度对数据质量进行评价和改善.但在目前数据质量管理过程中,影响数据可用性的多种重要因素并非完全孤立,在评估机制和指导数据清洗规则时,彼此会发生关联.研究了在实际信息系统中适用的综合性数据质量评估方法,将文献所提出以及在实际的信息系统中常用的数据质量性质指标按其定义与性质进行了归纳总结,提出了基于性质的数据质量综合评估框架.之后针对影响数据可用性的4个重要性质:精确性、完整性、一致性以及时效性整理出在数据集合上的操作方法,并逐一介绍其违反模式的定义,随后给出其具体关系证明,进而确定数据质量多维关联关系评估策略,并通过实验验证了该策略的有效性.
推荐文章
基于关联关系的海洋数值预报数据推荐算法研究
海洋数值预报
数据推荐
关联分析
信息挖掘
数据获得
语义分析
大数据关联关系度量研究综述
大数据
关联性分析
关联度量
多模态数据
基于关联规则挖掘的数据质量提高方法研究
数据质量
数据挖掘
关联规则
设备故障统计数据与电能质量监测数据的关联分析
大数据
电能质量
关联分析
设备故障
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据质量多种性质的关联关系研究
来源期刊 软件学报 学科 工学
关键词 数据质量 数据质量性质 多性质关系 数据清洗 数据管理
年,卷(期) 2016,(7) 所属期刊栏目 大数据可用性理论、方法和技术专题
研究方向 页码范围 1626-1644
页数 19页 分类号 TP311
字数 18602字 语种 中文
DOI 10.13328/j.cnki.jos.005040
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李建中 哈尔滨工业大学计算机科学与技术学院 237 6003 33.0 72.0
2 王宏志 哈尔滨工业大学计算机科学与技术学院 69 557 12.0 21.0
3 高宏 哈尔滨工业大学计算机科学与技术学院 109 1574 18.0 36.0
4 丁小欧 哈尔滨工业大学计算机科学与技术学院 4 35 1.0 4.0
5 张笑影 哈尔滨工业大学计算机科学与技术学院 1 35 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (211)
参考文献  (9)
节点文献
引证文献  (35)
同被引文献  (105)
二级引证文献  (203)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(2)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(1)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(28)
  • 引证文献(8)
  • 二级引证文献(20)
2018(65)
  • 引证文献(11)
  • 二级引证文献(54)
2019(90)
  • 引证文献(11)
  • 二级引证文献(79)
2020(53)
  • 引证文献(4)
  • 二级引证文献(49)
研究主题发展历程
节点文献
数据质量
数据质量性质
多性质关系
数据清洗
数据管理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导