基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在当今的时代,网络文本的数量正在迅速增长。文本的分析仍然是当今一个热门话题。由于传统的VSM模型在使用时会出像数据的纬度太高,缺乏对潜在语意理解等问题,导致最终的聚类结果的精确度不够高。鉴于此,提出了VSM和LDA的文本聚类的混合模型,通过对文本的处理,筛选,统计的方法得到特征词权重的集合,随后分别计算VSM模型和LDA模型相似度,通过将两个相似度进行线性相加的方法相结合,得到混合相似度,然后通过K-means算法进行文本聚类,分别得到VSM模型、LDA模型和混合模型的聚类结果,通过统计与分析得到最后的实验结果。实验结果表明,该混合模型是有效。
推荐文章
基于优化密度的耦合空间LDA文本聚类算法研究
文本聚类
耦合空间模型
LDA主题模型
密度
阈值
基于LDA的英汉维文本聚类系统的设计与实现
文本聚类
LDA模型
多语言
文本特征提取
相似度聚类
权重
基于LDA模型的文本聚类检索
主题模型
文本聚类
潜在狄利克雷分配模型
聚类评价
信息检索
基于LDA-wSVM模型的文本分类研究
文本分类
潜在狄利克雷分布
支持向量机
权重计算
吉普斯抽样
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于VSM和LDA混合模型的文本聚类研究
来源期刊 电脑知识与技术:学术交流 学科 工学
关键词 聚类 相似度 LDA VSM K-MEANS
年,卷(期) 2018,(1) 所属期刊栏目
研究方向 页码范围 35-38
页数 4页 分类号 TP312
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 熊海涛 5 14 2.0 3.0
2 刘晓蒙 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类
相似度
LDA
VSM
K-MEANS
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术:学术版
旬刊
1009-3044
34-1205/TP
安徽合肥市濉溪路333号
26-188
出版文献量(篇)
41621
总下载数(次)
23
总被引数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
电脑知识与技术:学术版2018年第9Z期 电脑知识与技术:学术版2018年第9X期 电脑知识与技术:学术版2018年第9期 电脑知识与技术:学术版2018年第8X期 电脑知识与技术:学术版2018年第8期 电脑知识与技术:学术版2018年第7Z期 电脑知识与技术:学术版2018年第7X期 电脑知识与技术:学术版2018年第7期 电脑知识与技术:学术版2018年第6Z期 电脑知识与技术:学术版2018年第6X期 电脑知识与技术:学术版2018年第6期 电脑知识与技术:学术版2018年第5Z期 电脑知识与技术:学术版2018年第5X期 电脑知识与技术:学术版2018年第5期 电脑知识与技术:学术版2018年第4Z期 电脑知识与技术:学术版2018年第4X期 电脑知识与技术:学术版2018年第4期 电脑知识与技术:学术版2018年第3Z期 电脑知识与技术:学术版2018年第3X期 电脑知识与技术:学术版2018年第3期 电脑知识与技术:学术版2018年第2Z期 电脑知识与技术:学术版2018年第2X期 电脑知识与技术:学术版2018年第2期 电脑知识与技术:学术版2018年第1Z期 电脑知识与技术:学术版2018年第1X期 电脑知识与技术:学术版2018年第12Z期 电脑知识与技术:学术版2018年第12X期 电脑知识与技术:学术版2018年第12期 电脑知识与技术:学术版2018年第11Z期 电脑知识与技术:学术版2018年第11X期 电脑知识与技术:学术版2018年第11期 电脑知识与技术:学术版2018年第10Z期 电脑知识与技术:学术版2018年第10X期 电脑知识与技术:学术版2018年第10期 电脑知识与技术:学术版2018年第1期
论文1v1指导