作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
分析了文本自动分类的关键理论及技术,给出一个已实现的基于向量空间模型(VSM)的文本自动分类系统的框架模型,重点描述此系统的实现算法.此算法在训练阶段通过部分训练集确定向量的特征提取维数,并提出一种"平均值"匹配阈值调整方法,从而在精度和效率方面优于传统的分类算法.实验表明此系统查准率为91.8%,查全率为85%.
推荐文章
基于向量空间模型的文本自动分类系统的研究与实现
文本分类
中文信息处理
向量空间模型
一个基于向量空间模型的中文文本自动分类系统
文本分类
中文文本
向量空间模型
特征提取
基于改进的向量空间模型的自动文本分类
自动文本分类
向量空间模型
位置权重
词的位置区分度
基于向量空间模型的文本自动分类系统的研究与实现
文本分类
中文信息处理
向量空间模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于向量空间模型的文本自动分类系统的研究与实现
来源期刊 北方交通大学学报 学科 工学
关键词 文本分类 向量空间模型 特征提取
年,卷(期) 2003,(2) 所属期刊栏目 计算机与信息
研究方向 页码范围 38-41
页数 4页 分类号 TP274.3
字数 3330字 语种 中文
DOI 10.3969/j.issn.1673-0291.2003.02.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 须德 北方交通大学计算机与信息技术学院 21 500 9.0 21.0
2 武旭 北方交通大学计算机与信息技术学院 2 75 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (234)
参考文献  (2)
节点文献
引证文献  (45)
同被引文献  (49)
二级引证文献  (122)
1975(2)
  • 参考文献(1)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2004(4)
  • 引证文献(4)
  • 二级引证文献(0)
2005(12)
  • 引证文献(10)
  • 二级引证文献(2)
2006(14)
  • 引证文献(2)
  • 二级引证文献(12)
2007(17)
  • 引证文献(5)
  • 二级引证文献(12)
2008(14)
  • 引证文献(2)
  • 二级引证文献(12)
2009(12)
  • 引证文献(2)
  • 二级引证文献(10)
2010(12)
  • 引证文献(4)
  • 二级引证文献(8)
2011(11)
  • 引证文献(5)
  • 二级引证文献(6)
2012(16)
  • 引证文献(5)
  • 二级引证文献(11)
2013(9)
  • 引证文献(0)
  • 二级引证文献(9)
2014(8)
  • 引证文献(0)
  • 二级引证文献(8)
2015(5)
  • 引证文献(1)
  • 二级引证文献(4)
2016(6)
  • 引证文献(0)
  • 二级引证文献(6)
2017(4)
  • 引证文献(1)
  • 二级引证文献(3)
2018(7)
  • 引证文献(3)
  • 二级引证文献(4)
2019(14)
  • 引证文献(1)
  • 二级引证文献(13)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
文本分类
向量空间模型
特征提取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京交通大学学报
双月刊
1673-0291
11-5258/U
大16开
北京西直门外上园村3号
1975
chi
出版文献量(篇)
3626
总下载数(次)
7
总被引数(次)
38401
论文1v1指导