基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
潜在语义索引(LSI)模型能在一定程度上解决一词多义和多词一义问题,并能过滤一部分文档噪音.然而在LSI模型中,一些对分类贡献大的特征,由于其对应的特征值小而被滤掉.针对这一问题,文中提出了一种扩展LSI模型的文本分类模型.该模型在尽量保留文档信息的同时,增加考虑了文档的类别信息,从而能比LSI模型更好地表示原始文档空间中的潜在语义结构.
推荐文章
一种基于潜在语义分析和直推式谱图算法的文本分类方法LSASGT
直推式谱图
潜在语义分析
文本分类
图构造
概率潜在语义分析的KNN文本分类算法
文本分类
KNN算法
文本表示模型
语义分类
概率潜在主题模型
基于潜在语义对偶空间的跨语言文本分类研究
跨语言分类
潜在语义对偶空间
潜在语义对
平行语料库
基于概念特征的语义文本分类
语义文本分类
概念特征
本体
支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于潜在语义结构的文本分类模型
来源期刊 华南理工大学学报(自然科学版) 学科 工学
关键词 文本分类 潜在语义索引 偏最小二乘法
年,卷(期) 2004,(z1) 所属期刊栏目
研究方向 页码范围 99-102
页数 4页 分类号 TP18
字数 3724字 语种 中文
DOI 10.3321/j.issn:1000-565X.2004.z1.022
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王明文 江西师范大学计算机信息工程学院 115 1470 19.0 34.0
2 曾雪强 江西师范大学计算机信息工程学院 7 132 4.0 7.0
3 陈素芬 江西师范大学计算机信息工程学院 2 57 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (57)
同被引文献  (97)
二级引证文献  (322)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2005(9)
  • 引证文献(7)
  • 二级引证文献(2)
2006(18)
  • 引证文献(6)
  • 二级引证文献(12)
2007(29)
  • 引证文献(8)
  • 二级引证文献(21)
2008(29)
  • 引证文献(8)
  • 二级引证文献(21)
2009(32)
  • 引证文献(10)
  • 二级引证文献(22)
2010(41)
  • 引证文献(4)
  • 二级引证文献(37)
2011(37)
  • 引证文献(3)
  • 二级引证文献(34)
2012(46)
  • 引证文献(3)
  • 二级引证文献(43)
2013(28)
  • 引证文献(1)
  • 二级引证文献(27)
2014(28)
  • 引证文献(2)
  • 二级引证文献(26)
2015(28)
  • 引证文献(2)
  • 二级引证文献(26)
2016(17)
  • 引证文献(1)
  • 二级引证文献(16)
2017(10)
  • 引证文献(0)
  • 二级引证文献(10)
2018(17)
  • 引证文献(1)
  • 二级引证文献(16)
2019(7)
  • 引证文献(0)
  • 二级引证文献(7)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
文本分类
潜在语义索引
偏最小二乘法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华南理工大学学报(自然科学版)
月刊
1000-565X
44-1251/T
大16开
广州市天河区五山路华南理工大学内
46-174
1957
chi
出版文献量(篇)
6648
总下载数(次)
17
总被引数(次)
75046
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导