基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
特征选择在文本分类技术中是一个重要的关键部分,特征选择的好坏直接决定最终的分类结果.卡方统计量(CHI-square statistic,CHI)和互信息(mutual information,MI)是特征选择模块经常使用的方法.针对卡方统计量方法不考虑词频的不足,引入词频因子.考虑互信息方法倾向选择低频词的缺点,并研究特征词在不同类别文档内的分布情况对互信息方法的特征选择的影响,通过引入特征的词频因子和调节参数对卡方统计量方法和互信息方法进行改进,并混合改进后的卡方统计量方法和互信息方法,提出一种混合的特征选择算法(CHMI).通过对CHI方法、MI方法、改进的CHI方法、改进的MI方法和CHMI方法进行实验对比,使用CHMI方法进行特征选择,使最终分类结果的查准率和F1值都有了提高,验证了CHMI方法的有效性.
推荐文章
文本分类中基于CHI改进的特征选择方法
文本分类
卡方统计量
特征选择
不均衡数据集
基于改进CHI和带权ECE结合的特征选择方法
卡方统计
期望交叉熵
特征选择
文本分类
融合CHI与信息增益的情感文本特征选择
卡方统计量(CHI)
信息增益
特征选择
情感文本
随机森林
支持向量机
基于类别和改进的CHI相结合的特征选择方法
卡方检验
特征选择
情感分析
随机森林
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 混合CHI和MI的改进文本特征选择方法
来源期刊 计算机技术与发展 学科 工学
关键词 文本分类 特征选择 卡方统计 互信息 词频因子 调节参数
年,卷(期) 2018,(4) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 87-90,94
页数 5页 分类号 TP391
字数 4338字 语种 中文
DOI 10.3969/j.issn.1673-629X.2018.04.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 邱晓晖 南京邮电大学通信与信息技术学院 49 363 10.0 17.0
2 王振 南京邮电大学通信与信息技术学院 5 27 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (69)
共引文献  (355)
参考文献  (11)
节点文献
引证文献  (10)
同被引文献  (23)
二级引证文献  (5)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(5)
  • 参考文献(1)
  • 二级参考文献(4)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(9)
  • 参考文献(0)
  • 二级参考文献(9)
2004(6)
  • 参考文献(0)
  • 二级参考文献(6)
2005(14)
  • 参考文献(1)
  • 二级参考文献(13)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(6)
  • 参考文献(1)
  • 二级参考文献(5)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(6)
  • 参考文献(1)
  • 二级参考文献(5)
2012(8)
  • 参考文献(1)
  • 二级参考文献(7)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(6)
  • 参考文献(1)
  • 二级参考文献(5)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(3)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(3)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(11)
  • 引证文献(7)
  • 二级引证文献(4)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本分类
特征选择
卡方统计
互信息
词频因子
调节参数
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
相关基金
江苏省自然科学基金
英文译名:Natural Science Foundation of Jiangsu Province
官方网址:http://www.jsnsf.gov.cn/News.aspx?a=37
项目类型:
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导