原文服务方: 计算机应用研究       
摘要:
传统DFS特征选择算法在降维处理时既未考虑样本分布不均的情况,又未涉及负特征词对类别的影响.综合考虑DFS的缺陷并进行优化处理,将DFS与卡方检测算法CHI结合,提出一种改进型特征选择算法DFS-sCHI.引入负特证词作为类别划分的影响因子之一,解决不平衡数据集下所提特征词类别分布不均的问题.经实验分析,不平衡数据集下,DFS-sCHI相比较于DFS在分类精度上有明显提高.
推荐文章
不平衡数据集上的文本分类特征选择新方法
不平衡数据集
文本分类
特征选择
正类
负类
基于特征词关联性的同义词集挖掘算法
自然语言处理
同义词集
特征词
概念
“两面性”官员频现的根源及对策
“两面性”
政治生态
反腐败
不平衡数据集的分类方法研究
机器学习
不平衡数据
数据分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 不平衡数据集下特征词两面性的新型降维算法
来源期刊 计算机应用研究 学科
关键词 不平衡数据集 文本分类 特征选择 DFS-sCHI
年,卷(期) 2018,(7) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1947-1949,1969
页数 4页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2018.07.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王洪国 山东师范大学信息科学与工程学院山东省物流优化与预测工程技术研究中心 44 455 13.0 19.0
2 邵增珍 山东师范大学信息科学与工程学院山东省物流优化与预测工程技术研究中心 60 455 12.0 18.0
3 杜秋霞 山东师范大学信息科学与工程学院山东省物流优化与预测工程技术研究中心 2 7 1.0 2.0
4 付鑫 山东师范大学信息科学与工程学院山东省物流优化与预测工程技术研究中心 2 7 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (38)
参考文献  (14)
节点文献
引证文献  (1)
同被引文献  (10)
二级引证文献  (0)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(6)
  • 参考文献(1)
  • 二级参考文献(5)
2007(5)
  • 参考文献(2)
  • 二级参考文献(3)
2008(10)
  • 参考文献(0)
  • 二级参考文献(10)
2009(5)
  • 参考文献(2)
  • 二级参考文献(3)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(6)
  • 参考文献(3)
  • 二级参考文献(3)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
不平衡数据集
文本分类
特征选择
DFS-sCHI
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导