基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
机器学习的飞速发展使其成为数据挖掘领域最有效的工具之一,但算法的训练过程往往需要大量的用户数据,给用户带来了极大的隐私泄漏风险.由于数据统计特征的复杂性及语义丰富性,传统隐私数据发布方法往往需要对原始数据进行过度清洗,导致数据可用性低而难以再适用于数据挖掘任务.为此,提出了一种基于生成对抗网络(Generative Adversarial Network,GAN)的差分隐私数据发布方法,通过在GAN模型训练的梯度上添加精心设计的噪声来实现差分隐私,确保GAN可无限量生成符合源数据统计特性且不泄露隐私的合成数据.针对现有同类方法合成数据质量低、模型收敛缓慢等问题,设计多种优化策略来灵活调整隐私预算分配并减小总体噪声规模,同时从理论上证明了合成数据严格满足差分隐私特性.在公开数据集上与现有方法进行实验对比,结果表明本方法能够更高效地生成质量更高的隐私保护数据,适用于多种数据分析任务.
推荐文章
基于邻域差分滤波生成式对抗网络的数据增强方法
生成式对抗网络
邻域差分
特征提取
数据增强
面向数据直方图发布的差分隐私保护综述
直方图
差分隐私保护
静态数据集
噪声
隐私预算
动态数据流
基于生成对抗网络的恶意域名训练数据生成
恶意域名
DGA
生成对抗网络
检测
分类
基于生成对抗网络的航班起飞风险预测
航班起飞风险预测
数据增强
生成对抗网络
神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于生成对抗网络的差分隐私数据发布方法
来源期刊 电子学报 学科 工学
关键词 差分隐私 生成对抗网络 隐私数据发布 合成数据 数据挖掘
年,卷(期) 2020,(10) 所属期刊栏目 学术论文
研究方向 页码范围 1983-1992
页数 10页 分类号 TP301
字数 语种 中文
DOI 10.3969/j.issn.0372-2112.2020.10.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王娜 22 253 7.0 15.0
2 郭渊博 41 99 4.0 9.0
3 方晨 5 16 2.0 4.0
4 甄帅辉 1 0 0.0 0.0
5 唐国栋 3 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (8)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(6)
  • 参考文献(0)
  • 二级参考文献(6)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(10)
  • 参考文献(1)
  • 二级参考文献(9)
2018(4)
  • 参考文献(2)
  • 二级参考文献(2)
2019(4)
  • 参考文献(4)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
差分隐私
生成对抗网络
隐私数据发布
合成数据
数据挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子学报
月刊
0372-2112
11-2087/TN
大16开
北京165信箱
2-891
1962
chi
出版文献量(篇)
11181
总下载数(次)
11
总被引数(次)
206555
论文1v1指导