基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于数据缺失,数据库用户通常无法获得查询结果中的预期答案.它被称为“Why-not问题”,即“为什么预期的元组不会出现在结果中”.现有的方法通过列举可能的元组值来解释Why-not问题.枚举所给出解释的数量往往太大,无法由用户探索.完整性约束,如函数依赖,被用来排除不合格的解释.然而,许多属性在简化后解释中仅仅表示为变量,用户可能仍然无法理解.由于数据稀疏性,许多不合理的解释也会被推荐给用户.提出通过研究元组间两两比较关系,从而对Why-not问题的解释进行排序的方法.首先,重新定义为什么Why-not问题解释的形式没有变量,以便于用户理解;其次,对元组中的相等/不相等关系进行表示,提出在{0,1}表示的元组对的基础上学习统计模型,从而解决直接在原始数据上学习所带来的稀疏性问题,许多模型可以被用来推断概率,包括统计分布、分类和回归;最后,根据推断的概率对解释进行评价和排序.实验结果证明:利用统计、分类和回归方法计算两两关系概率分布的方法,可以为用户寻找Why-not问题的解释并返回较为高质量的解释.
推荐文章
支持近似图查询的Why-Not问题解释方法
近似图查询
why-not问题
回溯法
剪枝策略
两两稳定性网络模型的构造
两两稳定性
整数规划
社会网络
两两PQD序列的大数定律
两两PQD序列
弱大数定律
强大数定律
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 两两比较模型的Why-not问题解释及排序
来源期刊 软件学报 学科 工学
关键词 数据质量 数据清洗 条件函数依赖 缺失结果解释 解释排序
年,卷(期) 2019,(3) 所属期刊栏目 智能数据管理与分析技术专刊
研究方向 页码范围 620-647
页数 28页 分类号 TP311
字数 19238字 语种 中文
DOI 10.13328/j.cnki.jos.005700
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王建民 清华大学软件学院 123 1523 19.0 34.0
4 宋韶旭 清华大学软件学院 2 12 1.0 2.0
7 祁丹蕊 清华大学软件学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (1)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据质量
数据清洗
条件函数依赖
缺失结果解释
解释排序
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导