基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对大规模数据的分类问题,将监督学习与无监督学习结合起来,提出了一种基于分层聚类和重采样技术的支持向量机(SVM)分类方法.该方法首先利用无监督学习算法中的k-means聚类分析技术将数据集划分成不同的子集,然后对各个子集进行逐类聚类,分别选出各类中心邻域内的样本点,构成最终的训练集,最后利用支持向量机对所选择的最具代表样本点进行训练建模.实验表明,所提方法可以大幅度降低支持向量机的学习代价,其分类精度比随机欠采样更优,而且可以达到采用完整数据集训练所得的结果.
推荐文章
大规模数据集的多层聚类算法
谱聚类
聚类
图像分割
基于约束优化传播的改进大规模数据半监督式谱聚类算法
谱聚类
大规模数据
点对约束
相似性传播
奇异值分解
基于云计算技术的大规模数据聚类分析
云计算技术
大规模数据
聚类中心
相似系数
数据点密度
收敛速度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于分层聚类及重采样的大规模数据分类
来源期刊 计算机应用 学科 工学
关键词 海量数据 分类 聚类 重采样 支持向量机
年,卷(期) 2013,(10) 所属期刊栏目 人工智能
研究方向 页码范围 2801-2803
页数 3页 分类号 TP181
字数 3578字 语种 中文
DOI 10.11772/j.issn.1001-9081.2013.10.2801
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张永 辽宁师范大学计算机与信息技术学院 48 408 12.0 17.0
2 张玉婷 辽宁师范大学计算机与信息技术学院 12 31 3.0 5.0
3 浮盼盼 辽宁师范大学计算机与信息技术学院 1 11 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (52)
参考文献  (6)
节点文献
引证文献  (11)
同被引文献  (30)
二级引证文献  (13)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(4)
  • 参考文献(2)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(3)
  • 引证文献(3)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(7)
  • 引证文献(4)
  • 二级引证文献(3)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(8)
  • 引证文献(2)
  • 二级引证文献(6)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
海量数据
分类
聚类
重采样
支持向量机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导