基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着大数据时代的到来,如何在保护用户隐私的前提下完成多维类别数据上的频率分布估计问题成为研究热点.已有的工作主要是基于中心化差分隐私模型或本地化差分隐私模型完成安全算法的设计.鉴于上述两种模型在隐私保护程度或发布结果可用性方面的弊端,基于新兴的混洗差分隐私模型,设计用户数据收集策略,进而提供高安全、高可用的频率分布估计服务.考虑到多维类别属性的多维特征以及不同属性上取值域大小不等的异构特点,从扰动算法以及洗牌方式等角度出发,设计了基于单洗牌者以及多洗牌者的数据发布方案ARR-SS和SRR-MS.此外,结合上述两种方案的优势,通过填补技术消除属性间异构问题,提出了基于取值域填补的单洗牌者数据发布方案PSRR-SS.从理论上分析了3种策略的隐私保护程度以及误差级别,并利用4个真实数据集验证所提出方案在频率估计问题上的有效性.此外,将所提方案作为带噪数据库生成技术的加噪组件,评估随机梯度下降算法在生成带噪数据上的训练结果的可用性.实验结果展现了所提方案优于当前同类算法.
推荐文章
面向数据直方图发布的差分隐私保护综述
直方图
差分隐私保护
静态数据集
噪声
隐私预算
动态数据流
基于差分隐私机制的位置数据隐私保护策略
位置数据
访问频率
差分隐私保护
多级查询树
差分隐私保护研究综述
差分隐私
隐私保护
数据失真
数据挖掘
数据发布
大数据环境中交互式查询差分隐私保护模型
线性查询
差分隐私
矩阵机制
关联性分析
交替方向乘子法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 混洗差分隐私下的多维类别数据的收集与分析
来源期刊 软件学报 学科 工学
关键词 混洗差分隐私 隐私保护 多维类别数据 频率估计
年,卷(期) 2022,(3) 所属期刊栏目 数据库系统新型技术专题|SPECIAL TOPIC ON NEW TECHNIQUES OF DATABASE SYSTEMS
研究方向 页码范围 1093-1110
页数 18页 分类号 TP311
字数 语种 中文
DOI 10.13328/j.cnki.jos.006450
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
混洗差分隐私
隐私保护
多维类别数据
频率估计
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导