原文服务方: 计算机应用研究       
摘要:
通过分析特征词与类别间的相关性,提出了一种新的特征加权方法,依据特征词在特定类中出现的次数、特征词在某一类中的集中程度、特征词在特定类中的均匀分布程度来计算特征权值.通过与TF-IDF进行实验对比,新提出的TF-Var特征权重方法使得分类的微平均准确率得到了明显的提高.
推荐文章
一种线性与非线性相结合的图像缩小方法
图像缩小
线性
非线性
向量连分式
Samelson逆变换
一种基于多重因子加权的文本特征项权值计算方法
特征项
文本聚类
中文文本
自然语言处理
语义分析与词频统计相结合的中文文本相似度量方法研究
向量空间模型
语义分析
词频
概率分布
文本相似度
一种加权矩形提取表情特征的方法
加权矩形
积分图像
矩形模板
特征提取
表情识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种词频与方差相结合的特征加权方法
来源期刊 计算机应用研究 学科
关键词 文本分类 特征权重 词频 方差
年,卷(期) 2012,(6) 所属期刊栏目 算法研究探讨
研究方向 页码范围 2132-2134
页数 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2012.06.034
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘大有 吉林大学计算机科学与技术学院 211 4714 34.0 63.0
2 邵良杉 辽宁工程技术大学软件学院 189 1464 18.0 27.0
3 王威 辽宁工程技术大学软件学院 10 92 4.0 9.0
4 邱云飞 辽宁工程技术大学软件学院 70 620 13.0 22.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (74)
参考文献  (8)
节点文献
引证文献  (4)
同被引文献  (14)
二级引证文献  (11)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(8)
  • 参考文献(1)
  • 二级参考文献(7)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(4)
  • 参考文献(2)
  • 二级参考文献(2)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(3)
  • 参考文献(3)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(4)
  • 引证文献(1)
  • 二级引证文献(3)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(3)
  • 引证文献(0)
  • 二级引证文献(3)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本分类
特征权重
词频
方差
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导