原文服务方: 计算机应用研究       
摘要:
针对现有的空间向量模型在进行文本表示时忽略词条的位置和词条间关系的问题,提出了一种基于相对密度的多耦合文本聚类算法。在基于相对密度的聚类方法基础上,该算法根据相对密度越小文本相似性越小这一事实,将相对密度转换为文本相似度,融入了传统 DBSCAN 密度算法,并对核心对象的选取进行了优化。实验结果表明,与改进的 K-means 文本聚类和改进的 DBSCAN 文本聚类算法相比,本算法在文本聚类中更高效、聚类质量更优。
推荐文章
基于优化密度的耦合空间LDA文本聚类算法研究
文本聚类
耦合空间模型
LDA主题模型
密度
阈值
基于网格相对密度差的扩展聚类算法
多密度聚类算法
网格相对密度差
扩展聚类
近邻估计法
边界点
模糊函数
基于相对距离的密度聚类算法
相对距离
DBSCAN算法
多维二进制搜索树
聚类
基于网格的多密度聚类算法
密度阈值递减
多阶段聚类
边界点提取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于相对密度的多耦合文本聚类算法
来源期刊 计算机应用研究 学科
关键词 文本聚类 空间向量模型 相对密度 文本相似度 核心对象
年,卷(期) 2016,(6) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1624-1627
页数 4页 分类号 TP391.1|TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2016.06.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 邢长征 辽宁工程技术大学电子与信息工程学院 41 277 10.0 14.0
2 王星 辽宁工程技术大学电子与信息工程学院 27 164 8.0 12.0
3 王洪佳 辽宁工程技术大学电子与信息工程学院 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (45)
共引文献  (140)
参考文献  (13)
节点文献
引证文献  (6)
同被引文献  (6)
二级引证文献  (6)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(11)
  • 参考文献(5)
  • 二级参考文献(6)
2012(4)
  • 参考文献(3)
  • 二级参考文献(1)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(6)
  • 引证文献(3)
  • 二级引证文献(3)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本聚类
空间向量模型
相对密度
文本相似度
核心对象
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导