原文服务方: 计算机应用研究       
摘要:
传统的主题检测方法以统计理论为基础,忽略了数据本身蕴涵的语义,带来了偏差严重、与样本数据高度相关等缺点.针对以上缺点,面向文本流数据,提出一种基于特征本体的主题检测方法.首先构建文本特征本体;其次,将较为复杂的文本特征本体看做是由若干主题组成的连通图,然后将主题连通图分解成单边图集合;再次,将主题相似度计算问题转换为单边图贡献度和图相似度的计算问题;最后,对每一批新文本集检测是否有新主题,从而使得主题的个数随着时间的推移而增加.在科技文献和新闻语料上进行实证研究,结果发现阈值δ参数决定文本流中新主题出现的频率,且实验结果同经典主题模型基本保持一致.除此之外,同传统的方法相比,提出的方法能更好地支持主题的语义表示,且适用于流数据,能增量实现主题检测,在应用上具有更大的优势.
推荐文章
基于主题本体树的文本流层次主题检测技术
文本流
层次主题检测
主题本体树
基于本体的企业文本检索模型研究
文本检索
文本分析
本体描述符
自然段
基于本体模糊映射和特征分析的网络入侵检测模型研究
网络入侵
本体模糊映射
特征分析
检测
模型
基于本体及相似度的文本聚类研究
本体
相似度
文本聚类
语义
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特征本体的文本流主题检测研究
来源期刊 计算机应用研究 学科
关键词 特征本体 主题检测 文本流
年,卷(期) 2016,(2) 所属期刊栏目 算法研究探讨
研究方向 页码范围 396-399
页数 4页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2016.02.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 向阳 同济大学电子与信息工程学院 88 1316 16.0 34.0
2 陈千 山西大学计算机与信息技术学院 11 42 4.0 6.0
3 郭鑫 山西大学计算机与信息技术学院 8 16 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (40)
共引文献  (58)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1951(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(6)
  • 参考文献(1)
  • 二级参考文献(5)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(7)
  • 参考文献(0)
  • 二级参考文献(7)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(7)
  • 参考文献(1)
  • 二级参考文献(6)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
特征本体
主题检测
文本流
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导