基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在大数据的时代背景下,由于网络数据(network data)能有效简洁地描述社交网络、电子商务、医疗记录、在线教育等多种应用中各类复杂关系,越来越受到工业界和学术界的关注。在社交网络分析任务中,一个基本操作是从网络中发现重要程度前 k 大的节点。紧密中心性(closeness centrality)是一种常见的节点重要性刻画指标,它用节点在网络中心的程度来反映节点的重要性。用紧密中心性衡量节点重要性进行节点搜索的问题称为 top-k 紧密中心性搜索问题。然而,传统的精确算法由于其多项式级别的复杂度无法高效地扩展到大规模的网络数据上。近来,研究人员提出了近似算法,通过牺牲结果精度来获得性能提升。通过分析发现,目前存在的近似算法虽然性能得到了有效提升,但是结果精度牺牲过大。为了解决这个问题,该文设计了一种新颖的近似算法,叫做基于 Sketch的紧密中心性搜索算法。此近似算法应用了一个全新的计算方式,利用 Sketch 估计同一距离的邻居数目,然后得到近似的最短距离之和,最终得到各个节点的紧密中心性的估计值。此算法的时间复杂度为 O(m tD max ),其中 t 是常数,D max 是网络直径,m 是网络边数。根据实际社交网络的小世界现象的特性,此近似算法基本是个线性算法。最后,相比于目前存在的精确算法和近似算法,该文通过全面的实验验证了基于 Sketch 的紧密中心性搜索算法在时间性能和结果精度等两方面的优势。
推荐文章
一种快速挖掘top-k高效用模式的算法
高效用模式
top-k模式挖掘
效用挖掘
数据挖掘
一种处理Top-k逆向查询的分支界定算法
Top-k逆向查询
分支界定算法
逆向Top-k算法
MapReduce框架下一种负载均衡的Top-k连接查询算法
Top-k连接查询
MapReduce框架
数据过滤
负载均衡
执行时间
基于MapReduce的top-k高效用模式挖掘算法
数据挖掘
top-k
高效用模式
MapReduce
并行算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于 Sketch 的 Top-k 紧密中心性快速搜索算法
来源期刊 计算机学报 学科 工学
关键词 紧密中心性 图算法 近似算法 图分析 社交网络
年,卷(期) 2016,(10) 所属期刊栏目 数据科学与工程
研究方向 页码范围 1965-1978
页数 14页 分类号 TP311
字数 12617字 语种 中文
DOI 10.11897/SP.J.1016.2016.01965
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 崔斌 北京大学信息科学技术学院高可信软件技术重点实验室 53 357 10.0 17.0
2 马林 北京大学信息科学技术学院高可信软件技术重点实验室 2 9 2.0 2.0
3 邵蓥侠 北京大学信息科学技术学院高可信软件技术重点实验室 3 5 1.0 2.0
4 阴红志 昆士兰大学信息技术和电子工程学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (89)
参考文献  (16)
节点文献
引证文献  (4)
同被引文献  (10)
二级引证文献  (3)
1953(1)
  • 参考文献(1)
  • 二级参考文献(0)
1959(1)
  • 参考文献(1)
  • 二级参考文献(0)
1966(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(2)
  • 参考文献(1)
  • 二级参考文献(1)
1978(2)
  • 参考文献(1)
  • 二级参考文献(1)
1985(1)
  • 参考文献(1)
  • 二级参考文献(0)
1987(2)
  • 参考文献(1)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
紧密中心性
图算法
近似算法
图分析
社交网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导