基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对当数据集合有敏感信息时,直接发布频繁序列模式本身及其支持度计数都有可能泄露用户隐私信息的问题,提出一种满足差分隐私(DP)的频繁序列模式挖掘(DP-FSM)算法.该算法利用向下封闭性质生成候选序列模式集,基于智能截断方法从候选模式中挑选出频繁的序列模式,最后采用几何机制对所选出模式的真实支持度添加噪声进行扰动.另外,为了提高挖掘结果的可用性,设计了一个阈值修正的策略来减小挖掘过程中的截断误差和传播误差.理论分析证明了该算法满足ε-差分隐私.实验结果表明了该算法在拒真率(FNR)和相对支持度误差(RSE)两个指标上明显低于对比算法PFS2,有效地提高了挖掘结果的准确度.
推荐文章
基于差分隐私的不确定数据频繁项集挖掘算法
差分隐私
不确定数据的频繁项集
截断期望支持度
采用填充字符的频繁序列模式挖掘算法
序列模式挖掘
填充字符
固定间隔
Apriori属性
基于不确定数据的可能频繁闭序列模式挖掘
不确定数据
可能频繁闭序列模式
概率频繁
不确定数据挖掘
闭序列模式
序列模式增长
序列模式挖掘中的隐私保护方法研究
数据挖掘
隐私保护
序列模式
敏感序列
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于差分隐私的频繁序列模式挖掘算法
来源期刊 计算机应用 学科 工学
关键词 频繁序列挖掘 差分隐私 隐私保护 几何机制 数据挖掘
年,卷(期) 2017,(2) 所属期刊栏目 第33届中国数据库学术会议(NDBC 2016)
研究方向 页码范围 316-321,340
页数 7页 分类号 TP311.13|TP301.6
字数 9763字 语种 中文
DOI 10.11772/j.issn.1001-9081.2017.02.0316
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王国仁 东北大学计算机科学与工程学院 228 2804 25.0 45.0
2 袁野 东北大学计算机科学与工程学院 16 113 5.0 10.0
3 刘浩 东北大学计算机科学与工程学院 22 317 7.0 17.0
4 李艳辉 东北大学计算机科学与工程学院 2 10 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (16)
参考文献  (3)
节点文献
引证文献  (8)
同被引文献  (20)
二级引证文献  (10)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(5)
  • 引证文献(3)
  • 二级引证文献(2)
2019(12)
  • 引证文献(4)
  • 二级引证文献(8)
研究主题发展历程
节点文献
频繁序列挖掘
差分隐私
隐私保护
几何机制
数据挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导