作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于网络的发展,中文文本的分类技术也有待提高.向量空间模型是中文文本分类中常用的模型,词作为中文文本的特征,其维数很高,如此高的维数对分类并不是都有用的.所以对特征的选择尤为重要,文章通过两种分类器对多种特征选择方法在同一平面内进行比较,将分类器的各种参数设为最优状态,得到了IG的分类效果较好,并且利用了平均查全率对不同的特征选择方法进行纵向与横向的比较,实验证明,SVM整体的分类效果要优于KNN的分类效果.
推荐文章
基于两种特征影响度的特征选择
特征选择
文本分类
特征影响度
文档分散程度
肛裂两种手术方法的疗效比较
肛裂
手术
疗效比较
脉宽调制两种采样方法的比较分析
采样
输出波形
比较分析
削弱谐波
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 两种分类方法特征选择的比较
来源期刊 电子技术 学科 工学
关键词 文本分类 特征选择 支持向量机
年,卷(期) 2007,(11) 所属期刊栏目 技术研发
研究方向 页码范围 132-134
页数 3页 分类号 TP3
字数 2838字 语种 中文
DOI 10.3969/j.issn.1000-0755.2007.11.037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王晓微 燕山大学信息科学与工程学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (12)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (5)
二级引证文献  (3)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
文本分类
特征选择
支持向量机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子技术
月刊
1000-0755
31-1323/TN
大16开
上海市长宁区泉口路274号
4-141
1963
chi
出版文献量(篇)
5480
总下载数(次)
19
论文1v1指导