原文服务方: 计算机应用研究       
摘要:
针对传统词项之间语义关系抽取难以适用于微博,导致发现微博热点事件不敏感的问题,提出一种基于词项语义共现和社团划分的方法发现热点事件.首先利用热度定义对微博数据进行初次筛选,通过构建共现词项图来模拟词项间的语义相关性,并结合修改的TF-IDF公式计算词项间的语义相关度;借助社区划分和模块度的概念对词项图进行划分,完成词项聚类,进而获得热点事件.实验结果表明,与同类方法相比,该方法的准确率较高,发现的热点事件与实时事件基本保持一致,具有较好的热点识别效果.
推荐文章
基于词共现网络的微博话题发现方法
微博
话题发现
短文本
社区划分
结合互信息和主题模型的微博话题发现方法
词共现矩阵
对称非负矩阵分解
概率潜在语义分析
微博热点话题发现
基于社团信息传播能力分析的微博舆情热点监测
舆情
微博
信息传播
传播社团
热点监测
基于语义共现图的中文微博新闻话题识别
微博
语义共现图
新闻话题识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用词项语义共现和社团划分发现微博热点事件
来源期刊 计算机应用研究 学科
关键词 热度 亲密度 语义相关性 热点事件 共现图 模块度
年,卷(期) 2020,(5) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1336-1339
页数 4页 分类号 TP391
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2018.09.0800
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马慧芳 西北师范大学计算机科学与工程学院 59 520 12.0 21.0
2 李晓红 西北师范大学计算机科学与工程学院 22 136 6.0 11.0
3 孔文文 西北师范大学计算机科学与工程学院 1 0 0.0 0.0
4 马堉垠 西北师范大学计算机科学与工程学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (46)
共引文献  (29)
参考文献  (12)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1971(1)
  • 参考文献(1)
  • 二级参考文献(0)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1978(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(8)
  • 参考文献(2)
  • 二级参考文献(6)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2016(6)
  • 参考文献(6)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
热度
亲密度
语义相关性
热点事件
共现图
模块度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导