原文服务方: 微电子学与计算机       
摘要:
互信息是文本分类中常用的特征选择方法.提出了一种新的基于互信息的特征选择方法.首先分析了特征选择影响文本分类精度的因素,将这些因素组合起来表征特征对于分类的强弱,并用公式直观地表示由组合因素计算出的特征值,根据这些值得大小选择对分类影响大的特征.最后理论证明了其可行性,并通过实验证明了该方法在提高分类精度方面比传统方法提高了10%.
推荐文章
文本分类中改进的互信息特征选择方法研究
文本分类
特征选择
评估函数
改进互信息
一种改进的互信息特征选取预处理算法
互信息
改进互信息
特征选取
文本分类
文本分类中互信息特征选择方法的研究
文本分类
特征选择
互信息
平衡因子
特征分布差异
一种基于反向文本频率互信息的文本挖掘算法研究
文本挖掘
互信息
向量空间模型
权重
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 文本分类中改进型互信息特征选择的研究
来源期刊 微电子学与计算机 学科
关键词 文本分类 特征选择 互信息 分类精度 影响因素
年,卷(期) 2008,(6) 所属期刊栏目
研究方向 页码范围 194-196,200
页数 4页 分类号 TP391
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘晓霞 西北大学信息科学与技术学院 53 1012 18.0 30.0
2 李亚军 西北大学信息科学与技术学院 4 97 3.0 4.0
3 陈平 西北大学信息科学与技术学院 8 106 4.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (128)
参考文献  (4)
节点文献
引证文献  (23)
同被引文献  (21)
二级引证文献  (50)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(2)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2010(7)
  • 引证文献(4)
  • 二级引证文献(3)
2011(6)
  • 引证文献(4)
  • 二级引证文献(2)
2012(15)
  • 引证文献(3)
  • 二级引证文献(12)
2013(5)
  • 引证文献(4)
  • 二级引证文献(1)
2014(8)
  • 引证文献(3)
  • 二级引证文献(5)
2015(7)
  • 引证文献(1)
  • 二级引证文献(6)
2016(7)
  • 引证文献(2)
  • 二级引证文献(5)
2017(7)
  • 引证文献(0)
  • 二级引证文献(7)
2018(6)
  • 引证文献(0)
  • 二级引证文献(6)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
文本分类
特征选择
互信息
分类精度
影响因素
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微电子学与计算机
月刊
1000-7180
61-1123/TN
大16开
1972-01-01
chi
出版文献量(篇)
9826
总下载数(次)
0
相关基金
陕西省自然科学基金
英文译名:Natural Science Basic Research Plan in Shaanxi Province of China
官方网址:
项目类型:
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导