基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
微博作为一个重要的信息平台,每天都有大量用户访问,重要的舆论事件在微博上会形成热门话题.本文提出了一种新的微博话题发现方法:基于词共现网络的话题发现方法(Topic detection in freqent word network,TDFWN),来挖掘微博语料中蕴含的热点话题.该方法首先对微博文本中的 k频繁词集(k≥3)进行挖掘,利用频繁词集的共现关系构建词共现网络.对该网络进行社区划分,同一社区内的词通常描述同一微博话题,即话题以社区的形式出现.实验结果表明 TDFWN算法能够快速、全面地发现微博中的热门话题,并且可以实现微博文本的自动聚类.
推荐文章
基于词共现图的中文微博新闻话题识别
微博
新闻话题
新闻话题识别
主题词
词共现图
基于SOM聚类的微博话题发现
话题发现
词向量模型
文本相似度
短文本
SOM聚类
基于隐主题分析的中文微博话题发现
中文微博
话题发现
隐主题模型
文本聚类
频繁项集挖掘
利用词项语义共现和社团划分发现微博热点事件
热度
亲密度
语义相关性
热点事件
共现图
模块度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于词共现网络的微博话题发现方法
来源期刊 数据采集与处理 学科 工学
关键词 微博 话题发现 短文本 社区划分
年,卷(期) 2018,(1) 所属期刊栏目
研究方向 页码范围 186-194
页数 9页 分类号 TP391
字数 6451字 语种 中文
DOI 10.16337/j.1004-9037.2018.01.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李伟 北京交通大学计算机与信息技术学院 36 195 8.0 12.0
3 贾彩燕 北京交通大学计算机与信息技术学院 23 180 9.0 12.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (56)
共引文献  (552)
参考文献  (10)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(12)
  • 参考文献(1)
  • 二级参考文献(11)
2007(6)
  • 参考文献(2)
  • 二级参考文献(4)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(7)
  • 参考文献(0)
  • 二级参考文献(7)
2012(7)
  • 参考文献(3)
  • 二级参考文献(4)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
微博
话题发现
短文本
社区划分
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
论文1v1指导