基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在"长尾现象",传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets collaborative Pruning iteration Clustering framework,FIPC).该算法将迭代聚类框架与K中心点算法相结合,运用协同剪枝策略,实现对小类别文本聚类,实验结果证明该聚类算法能够有效的提高小类别短文本信息聚类的精确度,并能避免聚类中类簇重叠的问题.
推荐文章
基于改进频繁模式聚类算法的网站结构优化
数据挖掘
频繁序列模式
压缩
Web设计
基于EM算法的文本聚类优化研究
硬聚类
软聚类
EM算法
文本聚类优化模型(TCOM)
基于相对密度的多耦合文本聚类算法
文本聚类
空间向量模型
相对密度
文本相似度
核心对象
基于文本挖掘的聚类算法研究
文本挖掘
K-means
K-medoids
准确率
召回率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于频繁模式的长尾文本聚类算法
来源期刊 计算机系统应用 学科
关键词 文本聚类 长尾现象 频繁模式 K中心点算法
年,卷(期) 2019,(4) 所属期刊栏目 软件技术·算法
研究方向 页码范围 139-144
页数 6页 分类号
字数 5611字 语种 中文
DOI 10.15888/j.cnki.csa.006852
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宋中山 中南民族大学计算机科学学院 68 536 12.0 21.0
2 帖军 中南民族大学计算机科学学院 54 202 7.0 12.0
3 尹帆 中南民族大学计算机科学学院 5 7 1.0 2.0
4 张广凯 中南民族大学计算机科学学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (75)
共引文献  (165)
参考文献  (13)
节点文献
引证文献  (1)
同被引文献  (1)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(8)
  • 参考文献(0)
  • 二级参考文献(8)
2010(8)
  • 参考文献(1)
  • 二级参考文献(7)
2011(17)
  • 参考文献(3)
  • 二级参考文献(14)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(8)
  • 参考文献(0)
  • 二级参考文献(8)
2014(4)
  • 参考文献(2)
  • 二级参考文献(2)
2015(5)
  • 参考文献(2)
  • 二级参考文献(3)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本聚类
长尾现象
频繁模式
K中心点算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
论文1v1指导