原文服务方: 计算机应用研究       
摘要:
基于类别信息的特征权重计算方法对特征与类别的关系表达不够准确,即对于类别频率相同的特征无法比较其对类别的区分能力,因此要考虑特征在类内的分布情况.将特征的反类别频率(inverse category frequency,ICF)和类内熵(entropy)相结合引入到特征权重计算方案中,构造了两种有监督特征权重计算方案.在维吾尔文文本分类语料上进行的实验结果表明,该方法能够明显改善样本的空间分布状态并提高维吾尔文文本分类的微平均F1值.
推荐文章
一种基于概念层次的文本特征权重计算方法
概念空间
特征权重
概念层次
特征支持度
类别强度
基于类别分布差异和特征熵的维吾尔语文本特征选择
特征选择
文本分类
特征熵
支持向量机
维吾尔语
基于类别方差的特征权重算法
特征权重
类别方差
文本分类
支持向量机
基于词频类别相关的特征权重算法
文本分类
文本表示
特征权重
文档频率
逆类频率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于类别信息和特征熵的文本特征权重计算
来源期刊 计算机应用研究 学科
关键词 文本分类 文本特征 权重计算 类别频率
年,卷(期) 2019,(11) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3237-3239,3285
页数 4页 分类号 TP391.1
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2018.05.0294
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 阿力木江·艾沙 新疆大学网络与信息技术中心 28 113 6.0 9.0
5 李喆 新疆大学网络与信息技术中心 15 80 4.0 8.0
6 库尔班·吾布力 新疆大学信息科学与工程学院 31 115 6.0 9.0
7 殷晓雨 新疆大学信息科学与工程学院 3 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (66)
共引文献  (54)
参考文献  (12)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(4)
  • 参考文献(0)
  • 二级参考文献(4)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(10)
  • 参考文献(2)
  • 二级参考文献(8)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(7)
  • 参考文献(1)
  • 二级参考文献(6)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
文本特征
权重计算
类别频率
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导