原文服务方: 计算机应用研究       
摘要:
针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法.该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文本相似度,并对阈值敏感问题进行优化,确定不同密度区域对应的阈值半径.实验结果表明,与改进的DBSCAN文本聚类算法和R-DBSCAN文本聚类算法相比,该算法的文本聚类精度更高、聚类效果更优.
推荐文章
基于相对密度的多耦合文本聚类算法
文本聚类
空间向量模型
相对密度
文本相似度
核心对象
基于EM算法的文本聚类优化研究
硬聚类
软聚类
EM算法
文本聚类优化模型(TCOM)
基于LDA的英汉维文本聚类系统的设计与实现
文本聚类
LDA模型
多语言
文本特征提取
相似度聚类
权重
基于GA优化QPSO算法的文本聚类
文本聚类
粒子群优化算法
量子行为粒子群优化算法
遗传算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于优化密度的耦合空间LDA文本聚类算法研究
来源期刊 计算机应用研究 学科
关键词 文本聚类 耦合空间模型 LDA主题模型 密度 阈值
年,卷(期) 2017,(7) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1966-1970
页数 5页 分类号 TP391.1|TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.07.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 邢长征 辽宁工程技术大学电子与信息工程学院 41 277 10.0 14.0
2 赵全颖 辽宁工程技术大学电子与信息工程学院 3 16 2.0 3.0
3 王星 辽宁工程技术大学电子与信息工程学院 27 164 8.0 12.0
4 王伟 辽宁工程技术大学电子与信息工程学院 39 229 9.0 13.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (45)
共引文献  (207)
参考文献  (14)
节点文献
引证文献  (6)
同被引文献  (17)
二级引证文献  (5)
1975(3)
  • 参考文献(1)
  • 二级参考文献(2)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(13)
  • 参考文献(7)
  • 二级参考文献(6)
2012(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(4)
  • 参考文献(1)
  • 二级参考文献(3)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(4)
  • 引证文献(3)
  • 二级引证文献(1)
2019(5)
  • 引证文献(2)
  • 二级引证文献(3)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本聚类
耦合空间模型
LDA主题模型
密度
阈值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导