基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现,包括对该系统的结构、预处理、特征提取、训练算法,分类算法等关键技术的介绍.通过引入结构层次权重系数来改进文本特征项权重,同时提出一种新的训练算法和文本相似度域值计算方法.实验结果证明:该分类系统能有效地提高文本分类效果,开放性测试的平均准确率在80 %以上,且平均查全率达到了86%.
推荐文章
基于隶属度限幅特征VSM的文本分类模型
模糊函数
隶属度限幅
类期望向量
文本分类
中文文本分类系统的设计与实现
文本分类
向量空间模型
特征项选择
权重
基于类别空间模型的文本分类系统的设计与实现
文本分类
向量空间模型
类别空间模型
一种面向机械领域文本分类器的设计
机械领域
灰色关联分析
贝叶斯分类器
特征选择
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于VSM文本分类系统的设计与实现
来源期刊 华中科技大学学报(自然科学版) 学科 工学
关键词 文本分类 向量空间模型 特征提取 结构层次权重系数 训练算法 分类算法
年,卷(期) 2005,(3) 所属期刊栏目
研究方向 页码范围 53-55
页数 3页 分类号 TP391
字数 2156字 语种 中文
DOI 10.3321/j.issn:1671-4512.2005.03.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李凡 华中科技大学计算机科学与技术学院 98 1647 20.0 37.0
2 林爱武 华中科技大学计算机科学与技术学院 2 73 2.0 2.0
3 陈国社 华中科技大学计算机科学与技术学院 2 53 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (45)
参考文献  (3)
节点文献
引证文献  (48)
同被引文献  (28)
二级引证文献  (81)
1973(1)
  • 参考文献(1)
  • 二级参考文献(0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2005(1)
  • 引证文献(1)
  • 二级引证文献(0)
2006(7)
  • 引证文献(7)
  • 二级引证文献(0)
2007(6)
  • 引证文献(6)
  • 二级引证文献(0)
2008(7)
  • 引证文献(7)
  • 二级引证文献(0)
2009(7)
  • 引证文献(3)
  • 二级引证文献(4)
2010(11)
  • 引证文献(6)
  • 二级引证文献(5)
2011(16)
  • 引证文献(4)
  • 二级引证文献(12)
2012(18)
  • 引证文献(7)
  • 二级引证文献(11)
2013(16)
  • 引证文献(1)
  • 二级引证文献(15)
2014(11)
  • 引证文献(3)
  • 二级引证文献(8)
2015(7)
  • 引证文献(1)
  • 二级引证文献(6)
2016(7)
  • 引证文献(0)
  • 二级引证文献(7)
2017(5)
  • 引证文献(0)
  • 二级引证文献(5)
2018(6)
  • 引证文献(1)
  • 二级引证文献(5)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
文本分类
向量空间模型
特征提取
结构层次权重系数
训练算法
分类算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华中科技大学学报(自然科学版)
月刊
1671-4512
42-1658/N
大16开
武汉市珞喻路1037号
38-9
1973
chi
出版文献量(篇)
9146
总下载数(次)
26
总被引数(次)
88536
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导