基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对新闻领域的专题组织进行了研究,提出了一种基于时序窗口的动态热点话题提取模型.该模型整合了热点话题的两个特点.一方面关注主题词在新闻文本中的广泛性,衡量标准为多频道播报特征项的频率综合,词频越高其广泛性越高;另一方面考虑新闻流主题词的突发性,表现为特定时间段内主题词出现频率显著异常于其它时间段.引入时序窗口进行上升和下降突发模式提取,并结合TF-DF作为主题词赋权值依据.实验结果表明,这种基于时序窗口的动态热点话题提取模型对新闻文本进行主题抽取具有很好的性能.
推荐文章
网络热点话题传播的脉冲时序行为动力模型
建模
时间序列
热点话题
脉冲噪声
基于多中心模型的网络热点话题发现算法
话题发现
热点话题
多中心
单遍聚类
基于内容的热点话题传播模型
热点话题
传播模型
传染病模型
话题传播模型
基于时序主题的网络舆情热点话题演化分析方法
网络舆情
话题追踪
时序主题
话题演化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于时序窗口的动态热点话题提取模型
来源期刊 高技术通讯 学科 工学
关键词 话题提取 时序窗口 广泛性 突发性 TF-PDF
年,卷(期) 2010,(6) 所属期刊栏目
研究方向 页码范围 590-595
页数 分类号 TP3
字数 6010字 语种 中文
DOI 10.3772/j.issn.1002-0470.2010.06.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 史忠植 中国科学院计算技术研究所智能信息处理重点实验室 232 9166 52.0 89.0
2 何清 中国科学院计算技术研究所智能信息处理重点实验室 30 782 13.0 27.0
3 马慧芳 中国科学院计算技术研究所智能信息处理重点实验室 8 252 4.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (18)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1980(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
话题提取
时序窗口
广泛性
突发性
TF-PDF
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
高技术通讯
月刊
1002-0470
11-2770/N
大16开
北京市三里河路54号
82-516
1991
chi
出版文献量(篇)
5099
总下载数(次)
14
总被引数(次)
39217
相关基金
国家科技支撑计划
英文译名:
官方网址:http://kjzc.jhgl.org/
项目类型:重大项目
学科类型:能源
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导