基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
短文本信息流在传递公开信息时携带了丰富且具有极大价值的信息资源。根据短文本信息流特点,利用训练数据集中的信息熵来构建决策树检测模型进行热点话题检测,该方法先是计算出各话题类别的平均信息量和每个特征词对于短文本信息流进行划分的信息增益率,再通过选择具有最大信息增益率的特征词进行测试,完成自上而下的决策树建树过程,最后利用叶子结点的类型确定热点话题。在真实短信文本信息流上实验表明,该方法具有明显的检测稳定性和较高的数据处理效率。
推荐文章
基于速度增长的微博热点话题发现
增长斜率
增长速度
时间二元组序列
热点发现
基于多策略的短文本信息流会话抽取
会话抽取
短文本
短文本信息流
词向量
聊天记录
基于数据挖掘技术的微博热点话题预测
数据挖掘
网络技术
微博话题
预测模型
微博负向情感热点话题发现模型
微博
负向情感
热点分析
事件发现
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于短文本信息流的热点话题检测
来源期刊 数据采集与处理 学科 工学
关键词 短文本 信息流 热点话题 决策树
年,卷(期) 2015,(2) 所属期刊栏目
研究方向 页码范围 464-468
页数 5页 分类号 TP391
字数 3760字 语种 中文
DOI 10.16337/j.1004-9037.2015.02.026
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘金岭 淮阴工学院计算机工程学院 63 355 10.0 15.0
2 宗慧 淮阴工学院计算机工程学院 10 28 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (44)
共引文献  (43)
参考文献  (7)
节点文献
引证文献  (8)
同被引文献  (28)
二级引证文献  (6)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(5)
  • 参考文献(1)
  • 二级参考文献(4)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(6)
  • 参考文献(0)
  • 二级参考文献(6)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(7)
  • 参考文献(1)
  • 二级参考文献(6)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(4)
  • 引证文献(2)
  • 二级引证文献(2)
2019(7)
  • 引证文献(3)
  • 二级引证文献(4)
研究主题发展历程
节点文献
短文本
信息流
热点话题
决策树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
论文1v1指导