原文服务方: 计算机应用研究       
摘要:
基于内容的邮件过滤本质是二值文本分类问题.特征选择在分类之前约简特征空间以减少分类器在计算和存储上的开销,同时过滤部分噪声以提高分类的准确性,是影响邮件过滤准确性和时效性的重要因素.但各特征选择算法在同一评价环境中性能不同,且对分类器和数据集分布特征具有依赖性.结合邮件过滤自身特点,从分类器适应性、数据集依赖性及时间复杂度三个方面评价与分析各特征选择算法在邮件过滤领域的性能.实验结果表明,优势率和文档频数用于邮件过滤时垃圾邮件识别的准确率较高,运算时间较少.
推荐文章
基于多特征模糊关联的垃圾邮件过滤方法
垃圾邮件过滤
模糊关联
证据理论
基于TF*IDF的垃圾邮件过滤特征选择改进算法
垃圾邮件
过滤器
贝叶斯
特征选择
TF*IDF
Naive Bayes邮件过滤模型的特征词选取方法研究
x2统计量
特征选取
垃圾邮件过滤
朴素贝叶斯
基于形象特征分析的垃圾邮件过滤系统的研究
形象特征
垃圾邮件
一类支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 邮件过滤中特征选择方法的性能评价与分析
来源期刊 计算机应用研究 学科
关键词 邮件过滤 特征选择 朴素贝叶斯 支持向量机
年,卷(期) 2012,(2) 所属期刊栏目 网络与通信技术
研究方向 页码范围 693-697
页数 分类号 TP393
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2012.02.078
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘培玉 山东师范大学信息科学与工程学院 126 1276 18.0 27.0
5 赵静 山东师范大学信息科学与工程学院 24 155 7.0 11.0
9 许明英 山东师范大学信息科学与工程学院 2 29 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (315)
参考文献  (10)
节点文献
引证文献  (18)
同被引文献  (32)
二级引证文献  (49)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(6)
  • 参考文献(1)
  • 二级参考文献(5)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(4)
  • 参考文献(4)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(5)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(5)
  • 二级引证文献(0)
2012(5)
  • 引证文献(5)
  • 二级引证文献(0)
2013(4)
  • 引证文献(4)
  • 二级引证文献(0)
2014(14)
  • 引证文献(2)
  • 二级引证文献(12)
2015(8)
  • 引证文献(2)
  • 二级引证文献(6)
2016(8)
  • 引证文献(3)
  • 二级引证文献(5)
2017(14)
  • 引证文献(1)
  • 二级引证文献(13)
2018(8)
  • 引证文献(1)
  • 二级引证文献(7)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
邮件过滤
特征选择
朴素贝叶斯
支持向量机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导