基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
邮件分类学习算法需要大量标注样本,人工标记工作费时费力.此外邮件内容因其表达方式上的特殊性,其特征空间一般是稀疏的,这种稀疏性会影响分类处理的效果.为了节省标记训练集的时间和精力,同时更好地处理稀疏的邮件数据,引入自适应选择最佳密度半径球形k-means聚类(SSk-means)算法,作为支持向量机(SVM)的前端处理,将训练集扩展后再送入SVM分类器.实验结果与性能比较表明,在训练集只有极少量标记邮件和一定量未标记邮件的情况下,该分类算法的性能较一般SVM有很大的提高.
推荐文章
基于SVM预分类学习的图像超分辨率重建算法
超分辨率重建
支持向量机(SVM)
颜色特征
样本学习
基于K-means与SVM结合的遥感图像全自动分类方法
K-means
支持向量机
遥感图像分类
基于仿射聚类的主动SVM多类分类方法
仿射传播聚类
多分类支持向量机
主动学习算法
训练样本点优化
基于深度信念网络的K-means聚类算法研究
K-means算法
深度信念网络
受限玻尔兹曼机
高维数据
聚类分析
FCM算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SSk-means聚类指导的邮件SVM分类学习算法
来源期刊 计算机工程与设计 学科 工学
关键词 邮件分类算法 球形k-means算法 标记样本 自适应选择最佳密度半径 支持向量机
年,卷(期) 2009,(2) 所属期刊栏目 人工智能
研究方向 页码范围 385-387,391
页数 4页 分类号 TP391
字数 4079字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李弼程 信息工程大学信息工程学院 102 1583 19.0 37.0
2 林琛 信息工程大学信息工程学院 10 144 6.0 10.0
3 郭志刚 信息工程大学信息工程学院 20 170 6.0 13.0
4 张曼 信息工程大学信息工程学院 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
邮件分类算法
球形k-means算法
标记样本
自适应选择最佳密度半径
支持向量机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
总被引数(次)
161677
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导