原文服务方: 西安工程大学学报       
摘要:
针对卡方统计量(CHI)忽略低频词对文本分类的影响以及信息增益(IG)只考虑对整体的贡献,忽略对局部影响的问题,通过分析CHI和IG特征选择算法,提出融合CHI和IG,适用于情感文本分类的文本特征选择算法(CHI-IG).该算法在CHI和IG 2种特征选择算法中增加了权值,集合这2种特征选择算法的优点,降低了2种方法不足带来的影响.并在此基础上对情感词的特征值附加权值区别于非情感词.基于该算法并采用随机森林(Random Forest)和支持向量机(SVM)分类方法对情感文本进行分类实验.结果表明,该方法能有效地提高情感文本的分类效率.
推荐文章
基于粗糙集与信息增益的情感特征选择方法
情感分析
特征选择
粗糙集
信息增益
集合CHI与IG的特征选择方法
文本分类
特征选择
卡方统计
信息增益
基于灰关系与信息增益融合的文本分类模型
信息增益
灰色理论
χ2统计
位置加权
文本分类
文本分类中基于CHI改进的特征选择方法
文本分类
卡方统计量
特征选择
不均衡数据集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合CHI与信息增益的情感文本特征选择
来源期刊 西安工程大学学报 学科
关键词 卡方统计量(CHI) 信息增益 特征选择 情感文本 随机森林 支持向量机
年,卷(期) 2018,(6) 所属期刊栏目 计算机科学
研究方向 页码范围 713-717
页数 5页 分类号 TP301.6
字数 语种 中文
DOI 10.13338/j.issn.1674-649x.2018.06.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张晓滨 西安工程大学计算机科学学院 26 210 8.0 14.0
2 黄梦莹 西安工程大学计算机科学学院 3 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (75)
共引文献  (467)
参考文献  (13)
节点文献
引证文献  (2)
同被引文献  (9)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(11)
  • 参考文献(0)
  • 二级参考文献(11)
2009(7)
  • 参考文献(0)
  • 二级参考文献(7)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2011(7)
  • 参考文献(2)
  • 二级参考文献(5)
2012(10)
  • 参考文献(3)
  • 二级参考文献(7)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(9)
  • 参考文献(1)
  • 二级参考文献(8)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
卡方统计量(CHI)
信息增益
特征选择
情感文本
随机森林
支持向量机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安工程大学学报
双月刊
1674-649X
61-1471/N
大16开
1986-01-01
chi
出版文献量(篇)
3377
总下载数(次)
0
总被引数(次)
15983
相关基金
陕西省自然科学基金
英文译名:Natural Science Basic Research Plan in Shaanxi Province of China
官方网址:
项目类型:
学科类型:
论文1v1指导