基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在线社交网络文本流中的热点短语能反映文本流中隐含的热点话题和突发事件。本文提出了一种无需分词并能支持多种热度度量函数的热点短语挖掘技术。首先用文本流的某个典型时段采样得到候选短语,构建AC-Trie前缀树。然后,基于该前缀树,单遍扫描后续的文本流,将候选短语的历史出现频率记录在Trie相应节点上,从而支持多种基于历史频率的热度计算方法。此外,为及时发现新的热点短语并减少AC-Trie的构建次数,本文通过分析Trie树各节点上的遗漏短语频率,动态确定候选短语的更新时机。新浪微博数据集上的实验验证了本文方法的有效性(准确率达89%)和高效性(时空开销仅为基准算法的2%)。
推荐文章
社交网络中热点话题深度挖掘方法及实验测试
社交网络
热点话题
挖掘
信息词条特征
基于SWT法网络社交平台图像文本检测
图像文本检测
网络社交平台
笔画宽度变换
文本区域检测
算法流程
仿真验证
基于TF*PDF的热点关键短语提取
TF*PDF
TDT
提取
脉冲值
关键词短语
社交网络用户行为挖掘研究进展与展望
社交网络
数据挖掘
用户行为
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于A C-Tri e的在线社交网络文本流热点短语挖掘
来源期刊 电子学报 学科 工学
关键词 文本流 热点短语 AC-Trie 文本挖掘 在线社交网络
年,卷(期) 2016,(10) 所属期刊栏目 学术论文
研究方向 页码范围 2466-2470
页数 5页 分类号 TP391
字数 4258字 语种 中文
DOI 10.3969/j.issn.0372-2112.2016.10.026
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴泉源 国防科学技术大学计算机学院 85 1515 24.0 36.0
2 贾焰 国防科学技术大学计算机学院 117 2188 23.0 43.0
3 黄九鸣 国防科学技术大学计算机学院 7 58 3.0 7.0
4 周斌 国防科学技术大学计算机学院 52 1325 19.0 35.0
5 刘东 国防科学技术大学计算机学院 5 128 4.0 5.0
6 张圣栋 国防科学技术大学计算机学院 2 6 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (18)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (3)
二级引证文献  (1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本流
热点短语
AC-Trie
文本挖掘
在线社交网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子学报
月刊
0372-2112
11-2087/TN
大16开
北京165信箱
2-891
1962
chi
出版文献量(篇)
11181
总下载数(次)
11
总被引数(次)
206555
论文1v1指导