基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种改进的基于特征提取的二级文本分类方法.通过提取出文本的特征项并计算其权重值,将文本表示成由特征项和权重值组成的向量,利用向量的夹角余弦计算二级分类模型下文本之间的相似度,可以更准确快速地定位海量信息.实验结果表明本文提出的分类方法的准确率优于传统的类中心分类法,提高了系统的适应性和分类能力.
推荐文章
一种基于PCA的组合特征提取文本分类方法
基于PCA的组合特征提取算法(PCA-CFEA)
主成分分析
特征提取
文本分类
一种基于语义标注特征的金融文本分类方法
文本分类
金融文本
语义标注
词汇—语义模式
有限状态机
文本分类中一种特征选择方法研究
文本分类
特征选择
分散度
集中度
频度
一种面向文本分类的特征向量优化方法
机器学习
Mahout
特征向量
向量优化
文本分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于特征提取的二级文本分类方法
来源期刊 广东工业大学学报 学科 工学
关键词 文本分类 特征提取 向量空间模型 KNN算法
年,卷(期) 2012,(4) 所属期刊栏目 综合研究
研究方向 页码范围 65-68
页数 4页 分类号 TP391.1
字数 3927字 语种 中文
DOI 10.3969/j.issn.1007-7162.2012.04.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 凌捷 广东工业大学计算机学院 133 1124 17.0 28.0
2 邹丽娜 广东工业大学计算机学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (88)
参考文献  (14)
节点文献
引证文献  (1)
同被引文献  (7)
二级引证文献  (11)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2008(3)
  • 参考文献(2)
  • 二级参考文献(1)
2009(5)
  • 参考文献(4)
  • 二级参考文献(1)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(5)
  • 参考文献(5)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(0)
  • 二级引证文献(2)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
文本分类
特征提取
向量空间模型
KNN算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
广东工业大学学报
双月刊
1007-7162
44-1428/T
16开
广东省广州市东风东路729号
1974
chi
出版文献量(篇)
2262
总下载数(次)
2
总被引数(次)
11966
论文1v1指导