原文服务方: 航空计算技术       
摘要:
将文本分类中的各种特征词选取方法引入到Naive Bayes邮件过滤模型(NBF)中,包括文档频度、信息增益、互信息、期望交叉熵、文本证据权、几率比及x2统计量.分析比较了这些方法的特点.实验结果显示在NBF中采用x2统计量选取邮件特征词有最好的效果.
推荐文章
基于改进Na(i)ve Bayes的垃圾邮件过滤模型研究
垃圾邮件过滤
朴素贝叶斯
期望交叉熵
特征选取
基于Bayes的一种改良垃圾邮件过滤模型
垃圾邮件
过滤
实时黑名单
朴素贝叶斯
邮件分级
改进贝叶斯垃圾邮件过滤技术的研究
垃圾邮件
贝叶斯
精确率
加权
粒子群
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Naive Bayes邮件过滤模型的特征词选取方法研究
来源期刊 航空计算技术 学科
关键词 x2统计量 特征选取 垃圾邮件过滤 朴素贝叶斯
年,卷(期) 2008,(2) 所属期刊栏目 计算机网络
研究方向 页码范围 131-134
页数 4页 分类号 TP393.098
字数 语种 中文
DOI 10.3969/j.issn.1671-654X.2008.02.035
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何聚厚 陕西师范大学计算机科学学院 59 259 9.0 13.0
2 王涛 陕西师范大学计算机科学学院 53 157 8.0 11.0
3 裘国永 陕西师范大学计算机科学学院 54 333 10.0 15.0
4 张娇艳 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (104)
参考文献  (5)
节点文献
引证文献  (4)
同被引文献  (5)
二级引证文献  (8)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(0)
  • 二级引证文献(3)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
x2统计量
特征选取
垃圾邮件过滤
朴素贝叶斯
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
航空计算技术
双月刊
1671-654X
61-1276/TP
大16开
西安市太白北路156号
1971-01-01
中文
出版文献量(篇)
3986
总下载数(次)
0
总被引数(次)
18592
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导