基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
聚类分析是数据挖掘和机器学习的一个重要分支,应用范围广,但在聚类分析过程中大量敏感信息的泄露对用户构成威胁.因此,在聚类分析过程中实现隐私保护至关重要.传统基于差分隐私(DP)的k-means聚类算法由于存在盲目选择初始中心点、对异常点敏感度较高等问题,导致在保护数据隐私时,出现聚类可用性较低的情况.针对该问题提出一种改进的基于差分隐私保护的(IDP)k-means聚类算法以提高聚类可用性,并进行理论分析和对比实验.理论分析表明,该算法满足ε-差分隐私;仿真实验结果表明,在同一隐私预算下,k-means算法改进后在聚类可用性上优于其它差分隐私k-means聚类算法,在同一数据集与同一隐私参数下,改进k-means算法在数据可用性方面比传统算法提高了将近5个百分点.
推荐文章
一种基于差分演化的K-medoids聚类算法
差分演化
聚类质量
K-medoids算法
全局优化
基于差分演化的K-均值聚类算法
聚类
差分演化算法
K-均值
差分隐私软大间隔聚类
差分隐私
软大间隔聚类
隐私保护
联邦学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的基于差分隐私的k-m eans聚类算法
来源期刊 软件导刊 学科 工学
关键词 差分隐私 k-means聚类 隐私保护
年,卷(期) 2019,(8) 所属期刊栏目 算法与语言
研究方向 页码范围 71-74
页数 4页 分类号 TP312
字数 3418字 语种 中文
DOI 10.11907/rjdk.191756
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 初广辉 山东科技大学计算机科学与工程学院 3 4 1.0 2.0
2 王晓利 山东科技大学计算机科学与工程学院 2 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (88)
共引文献  (55)
参考文献  (15)
节点文献
引证文献  (1)
同被引文献  (14)
二级引证文献  (0)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(6)
  • 参考文献(1)
  • 二级参考文献(5)
2009(5)
  • 参考文献(1)
  • 二级参考文献(4)
2010(7)
  • 参考文献(1)
  • 二级参考文献(6)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(7)
  • 参考文献(0)
  • 二级参考文献(7)
2015(16)
  • 参考文献(1)
  • 二级参考文献(15)
2016(16)
  • 参考文献(2)
  • 二级参考文献(14)
2017(10)
  • 参考文献(0)
  • 二级参考文献(10)
2018(10)
  • 参考文献(5)
  • 二级参考文献(5)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
差分隐私
k-means聚类
隐私保护
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导