基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着文本分类技术的发展与成熟,越来越多的企业将其应用到客户投诉分类系统中,并获得了一定的效果.针对传统卡方统计方法偏向于选择出负相关低频噪音词,将改进的CHI统计方法运用到文本特征选择,通过降低负相关低频词在特征选择算法中的权重,减小其对模型的影响.最后,对某省通信公司的业务投诉文本进行实验,结果表明该模型和方法是有效的,能更准确地对业务投诉工单进行分类,从而为后续问题的分析提供数据支持.
推荐文章
文本分类中基于CHI改进的特征选择方法
文本分类
卡方统计量
特征选择
不均衡数据集
基于改进的最大熵均值聚类方法在文本分类中的应用
文本分类
最大熵
C-均值聚类
特征选择
基于聚类改进的 KN N文本分类算法
文本分类
KNN
聚类化
训练集
基于改进的朴素贝叶斯文本分类研究
文本分类
朴素贝叶斯
K近邻
知网
中文分词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进的CHI统计方法在文本分类中的应用
来源期刊 计算机系统应用 学科
关键词 业务投诉 文本分类 特征选择 卡方统计方法
年,卷(期) 2016,(11) 所属期刊栏目 软件技术·算法
研究方向 页码范围 136-140
页数 5页 分类号
字数 4298字 语种 中文
DOI 10.15888/j.cnki.csa.005393
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄章树 福州大学经济与管理学院 73 579 14.0 20.0
2 叶志龙 福州大学经济与管理学院 5 62 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (124)
共引文献  (110)
参考文献  (15)
节点文献
引证文献  (20)
同被引文献  (68)
二级引证文献  (25)
1936(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(5)
  • 参考文献(0)
  • 二级参考文献(5)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(6)
  • 参考文献(0)
  • 二级参考文献(6)
2007(7)
  • 参考文献(0)
  • 二级参考文献(7)
2008(9)
  • 参考文献(0)
  • 二级参考文献(9)
2009(10)
  • 参考文献(0)
  • 二级参考文献(10)
2010(10)
  • 参考文献(1)
  • 二级参考文献(9)
2011(10)
  • 参考文献(1)
  • 二级参考文献(9)
2012(21)
  • 参考文献(2)
  • 二级参考文献(19)
2013(18)
  • 参考文献(1)
  • 二级参考文献(17)
2014(16)
  • 参考文献(2)
  • 二级参考文献(14)
2015(11)
  • 参考文献(8)
  • 二级参考文献(3)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(5)
  • 引证文献(4)
  • 二级引证文献(1)
2018(8)
  • 引证文献(7)
  • 二级引证文献(1)
2019(25)
  • 引证文献(8)
  • 二级引证文献(17)
2020(7)
  • 引证文献(1)
  • 二级引证文献(6)
研究主题发展历程
节点文献
业务投诉
文本分类
特征选择
卡方统计方法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
论文1v1指导