基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对互联网微博业务的广泛应用及其对大数据挖掘和分析的影响,提出一种基于标签的微博人脉网络挖掘算法。分析该网络的结构特征,利用微博用户标签,在模糊匹配过程中计算词语之间的匹配度时,主要考虑词语语素、次序和词长3个因素。为弱化以不同用户为起点对算法准确率的影响,分别以普通用户和名人用户为起点用户,挖掘微博人脉网络数据。同时,研究微博人脉网络的结构特性,通过分析发现微博人脉网络同时具有小世界和无标度特性。实验结果表明,运用该算法对名人用户和普通用户朋友中对IT感兴趣的人进行挖掘的误差率是可接受的。其中,挖掘10个名人用户朋友时算法的平均误差率为14.08%,挖掘10个普通用户朋友时算法的平均误差率为10.63%。
推荐文章
基于用户行为网络的微博意见领袖挖掘算法
意见领袖
微博
话题
PageRank
基于话题标签的微博主题挖掘
主题挖掘
微博
社交网络
话题标签主题模型
作者主题模型
基于主题和链接分析的微博社区发现算法
微博
社区发现
潜层Dirichlet分配
主题模型
链接分析
标签传递算法
基于用户标签的微博推荐算法
微博推荐算法
用户标签
TextRank排序方法
微博列表
效应函数
生命周期
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于标签的微博人脉网络挖掘算法和结构分析
来源期刊 计算机工程 学科 工学
关键词 标签 微博 人脉网络 模糊匹配 数据挖掘 结构特征
年,卷(期) 2014,(5) 所属期刊栏目 移动社交专题
研究方向 页码范围 7-11
页数 5页 分类号 TP393
字数 4861字 语种 中文
DOI 10.3969/j.issn.1000-3428.2014.05.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张连明 湖南师范大学物理与信息科学学院 46 256 8.0 15.0
2 王莎 湖南师范大学物理与信息科学学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (39)
参考文献  (5)
节点文献
引证文献  (3)
同被引文献  (8)
二级引证文献  (23)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2011(30)
  • 参考文献(2)
  • 二级参考文献(28)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(5)
  • 引证文献(1)
  • 二级引证文献(4)
2017(8)
  • 引证文献(0)
  • 二级引证文献(8)
2018(6)
  • 引证文献(0)
  • 二级引证文献(6)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
研究主题发展历程
节点文献
标签
微博
人脉网络
模糊匹配
数据挖掘
结构特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导