基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统K最近邻(KNN)分类算法为了找出待分类文本的k个邻居,需要与样本空间中的每个样本向量作比较,当训练样本较多时,导致相似度计算次数过多,分类速度下降.为此,改进了传统KNN算法,将训练文本中相似度大的文本合并,称为一簇,并计算簇的中心向量.待分类文本先与每一簇的中心向量计算相似度,当相似度达到某个阈值时,再与簇中的每个文本计算相似度,在一定程度上减少了相似度计算次数,降低了算法的时间复杂度.根据同一特征出现在文本中的位置不同应具有不同的权重改进了传统的TF-IDF计算公式.
推荐文章
基于最近邻距离权重的ML-KNN算法
多标签分类
ML-KNN
聚类
最近邻
距离权重
基于k-最近邻图的小样本KNN分类算法
KNN算法
k-最近邻图
小样本
图划分
分类算法
基于多K最近邻回归算法的软测量模型
多K最近邻
高斯过程
K最近邻
软测量模型
自适应仿射传播聚类
主元回归
基于K最近邻算法的网络不良信息过滤系统研究
K最近邻
不良信息
过滤
样本优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于簇的K最近邻(KNN)分类算法研究
来源期刊 计算机工程与设计 学科 工学
关键词 KNN算法 相似度计算次数 中心向量 TF_IDF算法
年,卷(期) 2009,(18) 所属期刊栏目 人工智能
研究方向 页码范围 4260-4262
页数 3页 分类号 TP311.12
字数 3695字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨炳儒 北京科技大学信息工程学院 319 4361 32.0 49.0
2 潘丽芳 北京科技大学信息工程学院 2 57 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (34)
共引文献  (50)
参考文献  (7)
节点文献
引证文献  (54)
同被引文献  (129)
二级引证文献  (188)
1956(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(8)
  • 参考文献(0)
  • 二级参考文献(8)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(4)
  • 参考文献(3)
  • 二级参考文献(1)
2008(3)
  • 参考文献(3)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(6)
  • 引证文献(6)
  • 二级引证文献(0)
2011(3)
  • 引证文献(3)
  • 二级引证文献(0)
2012(9)
  • 引证文献(7)
  • 二级引证文献(2)
2013(18)
  • 引证文献(9)
  • 二级引证文献(9)
2014(11)
  • 引证文献(3)
  • 二级引证文献(8)
2015(25)
  • 引证文献(11)
  • 二级引证文献(14)
2016(24)
  • 引证文献(1)
  • 二级引证文献(23)
2017(37)
  • 引证文献(4)
  • 二级引证文献(33)
2018(49)
  • 引证文献(5)
  • 二级引证文献(44)
2019(47)
  • 引证文献(5)
  • 二级引证文献(42)
2020(13)
  • 引证文献(0)
  • 二级引证文献(13)
研究主题发展历程
节点文献
KNN算法
相似度计算次数
中心向量
TF_IDF算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
总被引数(次)
161677
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导