原文服务方: 计算机应用研究       
摘要:
传统朴素贝叶分类算法没有根据特征项的不同对其重要程度进行划分,使得分类结果不准确.针对这一问题,引入Jensen-Shannon(JS)散度,用JS散度来表示特征项所能提供的信息量,并针对JS散度存在的不足,从类别内与类别间的词频、文本频以及用变异系数修正过的逆类别频率这三个方面考虑,对JS散度进行调整修正,最后计算出每一特征项的权值,将权值代入到朴素贝叶斯的公式中.通过与其他算法的对比实验证明,基于JS散度并从词、文本、类别三方面改进后的朴素贝叶斯算法的分类效果最好.因此基于JS散度特征加权的朴素贝叶斯分类算法与其他分类算法相比,其分类性能有很大提高.
推荐文章
一种新型加权朴素贝叶斯分类算法
数据挖掘
朴素贝叶斯
属性频率
基于属性约简的PLS加权朴素贝叶斯分类
加权朴素贝叶斯分类
属性约简
偏最小二乘回归
加权朴素贝叶斯算法在消防检测中的应用
消防检测
属性加权
朴素贝叶斯算法
信息增益
权重
基于引力模型的朴素贝叶斯分类算法
分类算法
朴素贝叶斯
引力模型
遥感图像
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进特征加权的朴素贝叶斯分类算法
来源期刊 计算机应用研究 学科
关键词 文本分类 朴素贝叶斯 JS散度 词频 文本频率 类别频率
年,卷(期) 2019,(12) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3597-3600,3627
页数 5页 分类号 TP391.1
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2018.07.0426
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 汪学明 贵州大学计算机科学与技术学院 71 197 7.0 8.0
2 丁月 贵州大学计算机科学与技术学院 2 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (104)
共引文献  (115)
参考文献  (14)
节点文献
引证文献  (4)
同被引文献  (22)
二级引证文献  (0)
1953(1)
  • 参考文献(0)
  • 二级参考文献(1)
1960(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(8)
  • 参考文献(0)
  • 二级参考文献(8)
2007(6)
  • 参考文献(1)
  • 二级参考文献(5)
2008(6)
  • 参考文献(0)
  • 二级参考文献(6)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(7)
  • 参考文献(0)
  • 二级参考文献(7)
2011(9)
  • 参考文献(1)
  • 二级参考文献(8)
2012(15)
  • 参考文献(1)
  • 二级参考文献(14)
2013(11)
  • 参考文献(2)
  • 二级参考文献(9)
2014(7)
  • 参考文献(2)
  • 二级参考文献(5)
2015(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(5)
  • 参考文献(2)
  • 二级参考文献(3)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(4)
  • 引证文献(4)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
朴素贝叶斯
JS散度
词频
文本频率
类别频率
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导