作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
主题分割技术是快速并有效地对新闻故事节目进行检索和管理的基础.传统的基于隐马尔可夫模型( Hidden Markov Model,HMM)的主题分割技术仅使用主题和主题之间的转移寻找主题边界进行新闻分割,并未考虑各主题中词与词之间存在的潜在语义关系.本文提出一种基于隐马尔科夫模型的改进算法.该算法使用潜在语义分析( Latent Semantic Analysis,LSA)对词频向量进行特征提取和降维,考虑了词与词之间的上下文关系,通过聚类得到文档类别信息,以LSA特征和主题类别作为HMM的观测和隐状态,这样同时考虑了主题之间的关系,最终实现对文本主题分割.数据实验表明,该算法具有较好的分割性能.
推荐文章
基于HMM的主题爬虫研究
主题爬虫
隐马尔科夫模型
向量空间模型
主题相关度
垂直搜索引擎
基于词替代策略的LSA预处理研究
词替代
潜在语义分析
同义词林
基于子词链的中文新闻广播故事自动分割
子词
词链
主题分割
故事分割
信息检索
语音文件检索
基于图的新闻事件主题句抽取方法
新闻事件
事件主题句
触发词
命名实体
事件关系
无向图
排序
抽取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于LSA-HMM的新闻主题分割
来源期刊 计算机与现代化 学科 工学
关键词 主题分割 隐马尔可夫模型 主题模型 潜在语义分析
年,卷(期) 2012,(5) 所属期刊栏目 算法设计与分析
研究方向 页码范围 27-30,34
页数 分类号 TP391
字数 4640字 语种 中文
DOI 10.3969/j.issn.1006-2475.2012.05.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 史倩 西北工业大学计算机学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (41)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
主题分割
隐马尔可夫模型
主题模型
潜在语义分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
论文1v1指导