作者:
原文服务方: 计算机应用研究       
摘要:
研究了改进的基于SVM-EM算法融合的朴素贝叶斯文本分类算法以及在垃圾邮件过滤中的应用.针对朴素贝叶斯算法无法处理基于特征组合产生的变化结果,以及过分依赖于样本空间的分布和内在不稳定性的缺陷,造成了算法时间复杂度的增加.为了解决上述问题,提出了一种改进的基于SVM-EM算法的朴素贝叶斯算法,提出的方法充分结合了朴素贝叶斯算法简单高效、EM算法对缺失属性的填补、支持向量机三种算法的优点,首先利用非线性变换和结构风险最小化原则将流量分类转换为二次寻优问题,然后要求EM算法对朴素贝叶斯算法要求条件独立性假设进行填补,最后利用朴素贝叶斯算法过滤邮件,提高分类准确性和稳定性.仿真实验结果表明,与传统的邮件过滤算法相比,该方法能够快速得到最优分类特征子集,大大提高了垃圾邮件过滤的准确率和稳定性.
推荐文章
贝叶斯垃圾邮件过滤算法的改进与实现
贝叶斯
垃圾邮件过滤
模式匹配
模糊匹配
垃圾邮件过滤的贝叶斯方法综述
垃圾邮件
贝叶斯分类
向量空间模型
朴素贝叶斯分类
基于贝叶斯神经网络的垃圾邮件过滤方法
贝叶斯神经网络
垃圾邮件
特征选择
信息增益
分类器
基于贝叶斯方法的一种垃圾邮件过滤的实现
贝叶斯方法
反垃圾邮件系统
垃圾邮件
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的贝叶斯算法在垃圾邮件过滤中的研究
来源期刊 计算机应用研究 学科
关键词 文本分类 垃圾邮件 朴素贝叶斯 支持向量机 EM
年,卷(期) 2012,(3) 所属期刊栏目 信息安全技术
研究方向 页码范围 1091-1094
页数 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2012.03.080
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (37)
共引文献  (559)
参考文献  (10)
节点文献
引证文献  (23)
同被引文献  (54)
二级引证文献  (31)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(4)
  • 参考文献(0)
  • 二级参考文献(4)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(4)
  • 参考文献(1)
  • 二级参考文献(3)
1999(7)
  • 参考文献(0)
  • 二级参考文献(7)
2000(6)
  • 参考文献(0)
  • 二级参考文献(6)
2001(3)
  • 参考文献(1)
  • 二级参考文献(2)
2002(11)
  • 参考文献(3)
  • 二级参考文献(8)
2003(3)
  • 参考文献(2)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(6)
  • 引证文献(6)
  • 二级引证文献(0)
2014(3)
  • 引证文献(3)
  • 二级引证文献(0)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2016(6)
  • 引证文献(6)
  • 二级引证文献(0)
2017(14)
  • 引证文献(5)
  • 二级引证文献(9)
2018(16)
  • 引证文献(2)
  • 二级引证文献(14)
2019(6)
  • 引证文献(0)
  • 二级引证文献(6)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本分类
垃圾邮件
朴素贝叶斯
支持向量机
EM
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导