原文服务方: 计算机应用研究       
摘要:
针对支持向量机在训练大规模数据集时出现的速度瓶颈问题,提出一种新的减样方法,称为双层减样法.数据减样时,双层减样法从粗、细粒度两个层次削减样本.粗粒度约减时,利用核空间距离聚类法,以簇为单位削减冗余子集;细粒度约减时,以点为单位挑选剩余点集中的支持向量.实验表明,双层减样法能有效地压缩样本数据,同时还能放大数据集的分类特征,提高分类器的分类精度.将此法应用于大规模SVM垃圾标签检测模型的训练集优化上,能明显提高检测模型的训练速度.双层减样法将粒度和层次的概念引入减样法中,在约减时适时改变约减幅度,这比传统减样法更具有优势.
推荐文章
用核K-means聚类和半定规划SVM实现垃圾标签检测
垃圾标签识别
支持向量机
多核函数组合
半定规划
基于支持向量机的垃圾标签检测模型
垃圾标签
社会化标签系统
支持向量机
检测模型
用核空间距离聚类约简大规模SVM训练集
核距离
聚类
减样
支持向量机
用KPCA-SVM的方法检测垃圾标签的研究
数据降维
核主成分分析法
支持向量机
垃圾标签
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 用双层减样法优化大规模SVM垃圾标签检测模型
来源期刊 计算机应用研究 学科
关键词 Folksonomy 垃圾标签 支持向量机 双层减样法 约减
年,卷(期) 2011,(6) 所属期刊栏目 算法研究探讨
研究方向 页码范围 2095-2098
页数 分类号 TP181
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2011.06.026
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 苏一丹 广西大学计算机与电子信息学院 114 849 16.0 23.0
2 覃希 广西工学院计算机工程系 8 123 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (15)
参考文献  (3)
节点文献
引证文献  (9)
同被引文献  (20)
二级引证文献  (12)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(4)
  • 引证文献(3)
  • 二级引证文献(1)
2014(5)
  • 引证文献(3)
  • 二级引证文献(2)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2016(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Folksonomy
垃圾标签
支持向量机
双层减样法
约减
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导