基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
识别海量变量间潜在的复杂关联关系,判断不同形式关联关系的强弱,是大数据关联关系挖掘的重要任务之一.然而,数据分布的不确定性、关联关系的多样性,使得基于分布假设的关联关系度量和基于数据驱动的非参数度量方法的适用性、准确性难以保证.因此,设计一种对关联关系形式无偏的有效关联度量方法变得至关重要.本文从大数据背景下潜在关联关系应被公平排序的需求出发,回顾了目前关联度量的公理化条件,给出了大数据关联关系度量可能需满足的性质;讨论了两类基于邻域视角的度量方法存在的不足;提出了本文基于k-NN粒的关联度量方法,称为最大邻域系数.人造数据集和真实数据集实验从不同角度验证了本文所提方法的有效性和优越性.最后指出了实验中发现的有趣现象和有待解决的理论问题,以引起对该领域更深入的思考和研究.
推荐文章
基于时空关联的高校社会网络关系挖掘方法研究
时空关联
社会网络关系
消费数据
MapReduce框架下基于正负关联规则的视频人物关系挖掘
视频人物关系
正负关联规则
人物关系细化
视频内容分析
基于扩展的嵌套关系代数的关联规则挖掘查询
数据挖掘查询
关联规则
嵌套代数
基于免疫算法的多维关联规则挖掘方法
数据挖掘
关联规则
免疫算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于邻域视角的关联关系挖掘方法
来源期刊 中国科学(信息科学) 学科
关键词 大数据 复杂关联关系挖掘 关联度量 数据驱动 粒计算 k-NN粒
年,卷(期) 2020,(6) 所属期刊栏目 大数据分析专题
研究方向 页码范围 824-844
页数 21页 分类号
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (51)
共引文献  (55)
参考文献  (22)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1959(1)
  • 参考文献(1)
  • 二级参考文献(0)
1981(1)
  • 参考文献(1)
  • 二级参考文献(0)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(7)
  • 参考文献(1)
  • 二级参考文献(6)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(5)
  • 参考文献(3)
  • 二级参考文献(2)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(6)
  • 参考文献(2)
  • 二级参考文献(4)
2014(10)
  • 参考文献(5)
  • 二级参考文献(5)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2017(7)
  • 参考文献(1)
  • 二级参考文献(6)
2018(2)
  • 参考文献(0)
  • 二级参考文献(2)
2019(2)
  • 参考文献(1)
  • 二级参考文献(1)
2020(1)
  • 参考文献(0)
  • 二级参考文献(1)
2020(1)
  • 参考文献(0)
  • 二级参考文献(1)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大数据
复杂关联关系挖掘
关联度量
数据驱动
粒计算
k-NN粒
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科学(信息科学)
月刊
1674-7267
11-5846/N
北京东黄城根北街16号
chi
出版文献量(篇)
1697
总下载数(次)
4
总被引数(次)
13096
论文1v1指导