基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前结合机器学习、文本分类的过滤方法成为研究热点.而这些过滤方法在邮件过滤时存在使用训练集数据量和表征数据的特征向量维数过多,引发"维灾难"和较大的运算量等问题.结合证据理论K近邻方法(evidence theory based K-nearest neighbors,EKNN)和直推式信度机(transductive confidence machines,TCM)算法思想,提出一种TCM-EKNN的邮件过滤方法,并且采用主动学习样本选择方法选择较少高质量的训练样本构建邮件分类器从而高效地实现垃圾邮件过滤.对比实验结果表明:相对于传统的邮件过滤方法,TCM-EKNN获得了良好的过滤效果,从而论证了TCM-EKNN有效性;并且在保证传统的邮件过滤方法同等高准确率前提下,TCM-EKNN采用主动学习方法后,极大地减少了训练样本数量,提高了过滤器性能,在各项评价指标上具有优越性.
推荐文章
集成学习和主动学习相结合的个性化垃圾邮件过滤
垃圾邮件过滤
个性化
集成学习
主动学习
支持向量机
基于主动学习和否定选择的垃圾邮件分类算法
文本分类
垃圾邮件检测
主动学习
否定选择
双向用户兴趣集
一种基于潜在语义索引的"垃圾"邮件过滤方法
信息检索
电子邮件
潜在语义索引
过滤
基于感知学习的垃圾邮件过滤算法
垃圾邮件过滤
感知学习
内容相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于主动学习和TCM-EKNN的邮件过滤方法
来源期刊 重庆邮电大学学报(自然科学版) 学科 工学
关键词 垃圾邮件 邮件过滤 主动学习 直推式可信K近邻 证据理论
年,卷(期) 2011,(1) 所属期刊栏目
研究方向 页码范围 85-90
页数 分类号 TP393.08
字数 5480字 语种 中文
DOI 10.3979/j.issn.1673-825X.2011.01.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈龙 重庆邮电大学计算机科学与技术研究所 56 544 12.0 21.0
2 董振兴 重庆邮电大学计算机科学与技术研究所 11 63 5.0 7.0
6 李荣 重庆邮电大学计算机科学与技术研究所 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (136)
参考文献  (7)
节点文献
引证文献  (4)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(6)
  • 参考文献(0)
  • 二级参考文献(6)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(8)
  • 参考文献(0)
  • 二级参考文献(8)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(6)
  • 参考文献(0)
  • 二级参考文献(6)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(3)
  • 参考文献(2)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
垃圾邮件
邮件过滤
主动学习
直推式可信K近邻
证据理论
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
重庆邮电大学学报(自然科学版)
双月刊
1673-825X
50-1181/N
大16开
重庆南岸区
78-77
1988
chi
出版文献量(篇)
3229
总下载数(次)
12
总被引数(次)
19476
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导