原文服务方: 计算机应用研究       
摘要:
文本分类存在维数灾难、数据集噪声及特征词对分类贡献不同等问题,影响文本分类精度.为提高文本分类精度,在数据处理方面提出一种新方法.该方法首先对数据集进行去噪处理,结合特征提取算法和语义分析方法对数据实现降维,再利用词语语义相关度对文本特征向量中每个特征词赋予不同权重;并利用经过上述处理的文本数据学习分类器.实验结果表明,该文本处理方法能够有效提高文本分类精度.
推荐文章
基于加权局部线性KNN的文本分类算法
稀疏表示
加权
局部线性K最近邻
文本分类
一种基于语义标注特征的金融文本分类方法
文本分类
金融文本
语义标注
词汇—语义模式
有限状态机
一种基于聚类加权的文本特征生成算法
文本分类
特征生成
权值计算
特征聚类
信息熵
基于改进特征加权的朴素贝叶斯分类算法
文本分类
朴素贝叶斯
JS散度
词频
文本频率
类别频率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于语义的文本特征加权分类算法
来源期刊 计算机应用研究 学科
关键词 语义分析 降维 语义相关度 分类
年,卷(期) 2012,(12) 所属期刊栏目 算法研究探讨
研究方向 页码范围 4476-4478
页数 3页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2012.12.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张化祥 山东师范大学信息科学与工程学院 73 576 14.0 19.0
5 张国栋 山东师范大学信息科学与工程学院 3 16 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (17)
参考文献  (7)
节点文献
引证文献  (9)
同被引文献  (16)
二级引证文献  (24)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(3)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(7)
  • 引证文献(4)
  • 二级引证文献(3)
2015(8)
  • 引证文献(2)
  • 二级引证文献(6)
2016(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(5)
  • 引证文献(1)
  • 二级引证文献(4)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
语义分析
降维
语义相关度
分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导