基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的判断2个文档相似性的方法没有考虑到文本背后的语义关联,导致检索系统返回的结果与用户的查询需求之间存在很大的差异.本文提出一种基于LDA主题模型的文本聚类方法,首先介绍LDA主题模型的应用原理,阐述文本挖掘的基本方法,之后构建LDA主题模型,采用Gibbs抽样的方法进行推导,得到特征词的概率分布,最后用优化聚类中心选择的K-means++方法对测试数据集合聚类,并把设计的LDA-Gibbs模型与传统的TF-IDF模型进行聚类评价对比.实验结果表明,该模型能够提高数据的检索效果,具有良好的推广价值.
推荐文章
基于优化密度的耦合空间LDA文本聚类算法研究
文本聚类
耦合空间模型
LDA主题模型
密度
阈值
基于LDA的英汉维文本聚类系统的设计与实现
文本聚类
LDA模型
多语言
文本特征提取
相似度聚类
权重
基于 LDA 模型的 Ad hoc 信息检索方法研究
信息检索
语言模型
文档模型
话题模型
利用本体技术的文本聚类模型
本体
文本聚类
概念主题
WordNet
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于LDA模型的文本聚类检索
来源期刊 计算机与现代化 学科 工学
关键词 主题模型 文本聚类 潜在狄利克雷分配模型 聚类评价 信息检索
年,卷(期) 2018,(6) 所属期刊栏目 算法设计与分析
研究方向 页码范围 7-11
页数 5页 分类号 TP391.1
字数 4444字 语种 中文
DOI 10.3969/j.issn.1006-2475.2018.06.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李春生 东北石油大学计算机与信息技术学院 56 125 6.0 8.0
2 李霄野 东北石油大学计算机与信息技术学院 2 12 2.0 2.0
3 李龙 东北石油大学计算机与信息技术学院 16 33 4.0 4.0
4 张可佳 东北石油大学计算机与信息技术学院 29 44 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (105)
共引文献  (173)
参考文献  (17)
节点文献
引证文献  (5)
同被引文献  (4)
二级引证文献  (3)
1975(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(7)
  • 参考文献(0)
  • 二级参考文献(7)
2004(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(8)
  • 参考文献(0)
  • 二级参考文献(8)
2008(8)
  • 参考文献(0)
  • 二级参考文献(8)
2009(7)
  • 参考文献(0)
  • 二级参考文献(7)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(17)
  • 参考文献(0)
  • 二级参考文献(17)
2012(12)
  • 参考文献(2)
  • 二级参考文献(10)
2013(11)
  • 参考文献(4)
  • 二级参考文献(7)
2014(6)
  • 参考文献(3)
  • 二级参考文献(3)
2015(4)
  • 参考文献(1)
  • 二级参考文献(3)
2016(5)
  • 参考文献(5)
  • 二级参考文献(0)
2017(3)
  • 参考文献(2)
  • 二级参考文献(1)
2018(3)
  • 参考文献(0)
  • 二级参考文献(3)
2019(4)
  • 参考文献(0)
  • 二级参考文献(4)
2020(2)
  • 参考文献(0)
  • 二级参考文献(2)
2018(3)
  • 参考文献(0)
  • 二级参考文献(3)
  • 引证文献(0)
  • 二级引证文献(0)
2019(6)
  • 引证文献(4)
  • 二级引证文献(2)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
主题模型
文本聚类
潜在狄利克雷分配模型
聚类评价
信息检索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导