原文服务方: 计算机应用研究       
摘要:
已有的矢量聚类算法需学习较多的复杂数据方可获得较好的聚类效果,而对于多维的大数据性能较弱,为此提出一种基于量化误差与分形理论的高计算效率无监督聚类算法。首先,为数据集建立量化误差的参数化模型,基于数据集的空间结构获得数据集的率失真曲线;然后通过对率失真曲线的估算,获得数据空间的有效维度;最终利用分形理论,通过搜索数据集的量化模型参数获得目标数据集的最优类簇数量。实验结果表明,该量化误差参数化模型可较好地估算数据集的有效维度,同时,本算法对数值型数据集的最优类簇估算与计算效率优于已有的矢量聚类算法。
推荐文章
基于复指数矩的模糊聚类分形编码研究
分形图像编码
复指数矩
模糊聚类
颜色对聚类量化算法的效率改进
聚类量化
颜色点选择
递归
分治
无监督环境下基于聚类集成的特征选择
特征聚类
无监督学习
集成聚类
基于DEM的流域地貌特征分形量化研究
分形布朗运动
地貌形态
GIS
像元尺度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于量化误差与分形理论的高计算效率无监督聚类研究
来源期刊 计算机应用研究 学科
关键词 分形理论 量化误差 率失真曲线 无监督聚类 多维数据
年,卷(期) 2016,(10) 所属期刊栏目 算法研究探讨
研究方向 页码范围 2919-2922
页数 4页 分类号 TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2016.10.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡国生 广东食品药品职业学院软件学院 6 29 4.0 5.0
2 杨海涛 浙江大学数学学院 4 20 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (24)
共引文献  (9)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1985(1)
  • 参考文献(1)
  • 二级参考文献(0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(3)
  • 参考文献(3)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分形理论
量化误差
率失真曲线
无监督聚类
多维数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导