基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统贝叶斯分类算法无法满足复杂网络文本过滤需求,提出一种多词-贝叶斯分类算法(Multi Word-Bayes,MWB).该算法一方面引入了特征权重(Term Frequency-Inverse Document Frequency,TF-IDF)的计算思想,优化了传统贝叶斯分类算法只考虑词频不考虑文本间关系的问题;另一方面将词与词间的关系作为文本分类的重要参考项,克服了传统贝叶斯分类算法在分类器训练上对语义分析的忽视.实验结果表明,MWB在垃圾文本过滤上具有更好的分类性能.
推荐文章
一种改进的贝叶斯算法在短信过滤中的研究
贝叶斯
最小风险
文本分类
短信过滤
基于改进特征加权的朴素贝叶斯分类算法
文本分类
朴素贝叶斯
JS散度
词频
文本频率
类别频率
一种改进的贝叶斯网络短文本分类算法
贝叶斯网络
连接强度
短文本分类
朴素贝叶斯算法在文本分类中的应用
有监督学习
文本分类
朴素贝叶斯算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于文本过滤的贝叶斯分类算法的改进
来源期刊 计算机与现代化 学科 工学
关键词 贝叶斯分类算法 TF-IDF 语义分析 文本过滤
年,卷(期) 2016,(9) 所属期刊栏目 算法设计与分析
研究方向 页码范围 100-103,108
页数 5页 分类号 TP311
字数 5756字 语种 中文
DOI 10.3969/j.issn.1006-2475.2016.09.022
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐开勇 19 127 7.0 10.0
2 戴乐育 2 11 2.0 2.0
3 路金泉 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (54)
共引文献  (143)
参考文献  (14)
节点文献
引证文献  (6)
同被引文献  (45)
二级引证文献  (5)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(8)
  • 参考文献(2)
  • 二级参考文献(6)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(8)
  • 参考文献(0)
  • 二级参考文献(8)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(8)
  • 参考文献(1)
  • 二级参考文献(7)
2013(4)
  • 参考文献(0)
  • 二级参考文献(4)
2014(4)
  • 参考文献(3)
  • 二级参考文献(1)
2015(5)
  • 参考文献(5)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(7)
  • 引证文献(2)
  • 二级引证文献(5)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
贝叶斯分类算法
TF-IDF
语义分析
文本过滤
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导