基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的KNN文本算法在计算文本之间的相似度时,只是做简单的概念匹配,没有考虑到训练集与测试集文本中词项携带的语义信息,因此在利用KNN分类器进行文本分类过程中有可能导致语义丢失,分类结果不准确.针对这种情况,提出了一种基于概率潜在主题模型的KNN文本分类算法.该算法预先使用概率主题模型对训练集文本进行文本-主题、主题-词项建模,将文本携带的语义信息映射到主题上的低维空间,把文本相似度用文本-主题、主题-词项的概率分布表示,对低维文本的语义信息利用KNN算法进行文本分类.实验结果表明,在训练较大的训练数据集和待分类数据集上,所提算法能够利用KNN分类器进行文本的语义分类,且能提高KNN分类的准确率和召回率以及F1值.
推荐文章
KNN文本分类算法研究
文本分类
KNN
向量空间模型
采用潜在概率语义模型和K近邻分类器的音频分类算法
梅尔频率倒谱系数
词-频共现矩阵
声音袋模型
潜在概率语义模型
K近邻分类器
基于混沌二进制粒子群优化的KNN文本分类算法
二进制粒子群
混沌
K最近邻
文本分类
基于加权局部线性KNN的文本分类算法
稀疏表示
加权
局部线性K最近邻
文本分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 概率潜在语义分析的KNN文本分类算法
来源期刊 计算机技术与发展 学科 工学
关键词 文本分类 KNN算法 文本表示模型 语义分类 概率潜在主题模型
年,卷(期) 2017,(7) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 57-61
页数 5页 分类号 TP301.6
字数 5660字 语种 中文
DOI 10.3969/j.issn.1673-629X.2017.07.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 顾磊 南京邮电大学计算机学院 25 149 4.0 12.0
2 戚后林 南京邮电大学计算机学院 2 13 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (89)
共引文献  (344)
参考文献  (9)
节点文献
引证文献  (5)
同被引文献  (32)
二级引证文献  (7)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(10)
  • 参考文献(0)
  • 二级参考文献(10)
2004(9)
  • 参考文献(0)
  • 二级参考文献(9)
2005(11)
  • 参考文献(0)
  • 二级参考文献(11)
2006(6)
  • 参考文献(1)
  • 二级参考文献(5)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(8)
  • 参考文献(0)
  • 二级参考文献(8)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2012(7)
  • 参考文献(0)
  • 二级参考文献(7)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(9)
  • 参考文献(1)
  • 二级参考文献(8)
2015(4)
  • 参考文献(3)
  • 二级参考文献(1)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(9)
  • 引证文献(3)
  • 二级引证文献(6)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本分类
KNN算法
文本表示模型
语义分类
概率潜在主题模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导