原文服务方: 计算机应用研究       
摘要:
对文本进行建模的普遍方法是使用向量空间模型构建文本向量,并利用权值调整和维度调整对文本向量进行优化.提出了一种面向文本分类的特征向量优化方法.首先利用剔除近义词方法优化文本向量中的特征项;然后提出贡献率因子的概念,并利用其优化特征值.实验表明,相比朴素贝叶斯分类方法其效果提高了0.96%.因此,通过去除近义词和对提取出的特征词调整权重,可以达到优化特征向量、提高文本分类效果的目的.
推荐文章
基于类别特征向量表示的中文文本分类算法
中文文本分类
向量空间模型
评价函数
特征提取
一种面向机械领域文本分类器的设计
机械领域
灰色关联分析
贝叶斯分类器
特征选择
文本分类中一种特征选择方法研究
文本分类
特征选择
分散度
集中度
频度
一种基于语义标注特征的金融文本分类方法
文本分类
金融文本
语义标注
词汇—语义模式
有限状态机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种面向文本分类的特征向量优化方法
来源期刊 计算机应用研究 学科
关键词 机器学习 Mahout 特征向量 向量优化 文本分类
年,卷(期) 2017,(8) 所属期刊栏目 算法研究探讨
研究方向 页码范围 2299-2302,2348
页数 5页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.08.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张仰森 北京信息科技大学智能信息处理研究所 104 721 15.0 23.0
2 蒋玉茹 北京信息科技大学智能信息处理研究所 15 57 4.0 7.0
3 郭正斌 北京信息科技大学智能信息处理研究所 3 21 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (115)
共引文献  (327)
参考文献  (18)
节点文献
引证文献  (16)
同被引文献  (60)
二级引证文献  (30)
1958(2)
  • 参考文献(0)
  • 二级参考文献(2)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(2)
  • 参考文献(0)
  • 二级参考文献(2)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(2)
  • 参考文献(0)
  • 二级参考文献(2)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(10)
  • 参考文献(1)
  • 二级参考文献(9)
2006(12)
  • 参考文献(0)
  • 二级参考文献(12)
2007(7)
  • 参考文献(0)
  • 二级参考文献(7)
2008(10)
  • 参考文献(3)
  • 二级参考文献(7)
2009(17)
  • 参考文献(2)
  • 二级参考文献(15)
2010(7)
  • 参考文献(1)
  • 二级参考文献(6)
2011(11)
  • 参考文献(2)
  • 二级参考文献(9)
2012(7)
  • 参考文献(2)
  • 二级参考文献(5)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(10)
  • 参考文献(3)
  • 二级参考文献(7)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(9)
  • 引证文献(9)
  • 二级引证文献(0)
2019(26)
  • 引证文献(4)
  • 二级引证文献(22)
2020(9)
  • 引证文献(1)
  • 二级引证文献(8)
研究主题发展历程
节点文献
机器学习
Mahout
特征向量
向量优化
文本分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导