基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
频繁模式挖掘是事务数据分析的常用技术,面向数据流的频繁模式挖掘具有重要的应用价值.然而当事务为敏感信息时,直接发布频繁模式及支持度会导致个体隐私泄露.差分隐私是一种严格且可证明的隐私保护模型,目前虽然已有基于差分隐私的频繁模式发布方案,但它们大都是面向静态数据做一次性发布的隐私保护.本文是面向数据流频繁模式发布的隐私保护,旨在设计一种兼顾可用性和发布效率的持续发布的差分隐私保护方案.与静态发布方案不同,面向数据流的隐私保护处理面临两大挑战:一是持续发布过程中隐私预算的累计消耗会造成发布结果可用性较低;二是候选模式集增大会造成发布结果误差较大和发布效率较低.为解决隐私预算的累计消耗问题,方案设计了满足event级差分隐私的保护机制.该机制可以最大化隐私预算利用率,提高发布结果可用性.为降低候选模式集大小,从而提高发布结果可用性和发布效率,方案首先设计了一种基于模式估计的长事务拆分预处理策略,并对拆分所致的信息丢失率进行了分析和弥补.然后在持续发布阶段,在基于Cantree的挖掘中,先基于支持度阈值对候选模式集进一步缩减.基于缩减后的候选模式集,本文设计了 一种蓄水池抽样和指数机制(EM)相结合的持续更新发布策略,该策略通过一遍扫描抽样集,在保证可用性和隐私保护级别的前提下提高了发布效率.最后,理论证明了该方案满足ε-差分隐私,实验结果验证了该方案具有较好的可用性和较高的工作效率.
推荐文章
面向数据直方图发布的差分隐私保护综述
直方图
差分隐私保护
静态数据集
噪声
隐私预算
动态数据流
多维数据流下的top-k支配查询算法研究
数据流
滑动窗口
top-k
Skyline
网格
一种面向分布式数据流的闭频繁模式挖掘方法
智能交通系统
分布式数据流
闭频繁模式挖掘
MapReduce
传感器网络
数据流中一种基于滑动窗口的前K个频繁项集挖掘算法
数据挖掘
数据流
频繁项集
滑动窗口
二进制
二分法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种面向数据流top-k频繁模式发布的差分隐私保护方案
来源期刊 计算机学报 学科
关键词 模式估计 差分隐私 蓄水池抽样 频繁模式挖掘 事务拆分
年,卷(期) 2021,(4) 所属期刊栏目 安全、隐私、区块链与信息隐藏
研究方向 页码范围 741-760
页数 20页 分类号 TP392
字数 语种 中文
DOI 10.11897/SP.J.1016.2021.00741
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (0)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(4)
  • 参考文献(3)
  • 二级参考文献(1)
2014(4)
  • 参考文献(3)
  • 二级参考文献(1)
2015(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(3)
  • 参考文献(0)
  • 二级参考文献(3)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
模式估计
差分隐私
蓄水池抽样
频繁模式挖掘
事务拆分
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
论文1v1指导