基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于算法的简单和效果的出色,Naive Bayes被广泛地应用到了垃圾邮件过滤当中.通过理论与实验分析发现,结构差异较大的邮件集特征分布差异也较大,这种特征分布差异影响到了Naive Bayes算法的效果.在此基础上,论文提出了一种基于结构特征的双层过滤模型,对不同结构的邮件使用不同的Naive Bayes分类器分开训练和学习.实验分析表明,Naive Bayes使用该模型之后效果有明显的提高,已经与SVM非常接近.
推荐文章
基于词汇链的文本过滤模型
词汇链
向量空间
用户模板
文本表示
WordNet
基于个性化特征的协同过滤推荐算法
个性化特征
协同过滤推荐
评分模型
项目属性
基于χ2统计量的不良文本过滤特征选择方法
特征选择
χ2统计量
双层分类
不良文本过滤
特征项分布
评估指标
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于结构特征的nBayes双层过滤模型
来源期刊 计算机应用 学科 工学
关键词 机器学习 朴素贝叶斯 文本分类 垃圾邮件 基于内容的过滤
年,卷(期) 2006,(1) 所属期刊栏目 人工智能与数据挖掘
研究方向 页码范围 191-194
页数 4页 分类号 TP182
字数 4580字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王斌 中国科学院计算技术研究所 325 6645 42.0 69.0
2 许洪波 中国科学院计算技术研究所 42 988 14.0 31.0
3 王申 中国科学院计算技术研究所 8 52 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (18)
同被引文献  (12)
二级引证文献  (24)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2006(2)
  • 引证文献(2)
  • 二级引证文献(0)
2007(5)
  • 引证文献(5)
  • 二级引证文献(0)
2008(6)
  • 引证文献(5)
  • 二级引证文献(1)
2009(12)
  • 引证文献(1)
  • 二级引证文献(11)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(3)
  • 引证文献(1)
  • 二级引证文献(2)
2012(6)
  • 引证文献(1)
  • 二级引证文献(5)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
机器学习
朴素贝叶斯
文本分类
垃圾邮件
基于内容的过滤
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导