基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本分类技术已经成为处理和组织文本信息的关键技术之一.KNN算法是文本分类中一种实用的方法.它在每次分类的过程中都要计算测试集中未标记文本与训练集合中所有样本的相似度(距离),然后通过排序来找到K个最近邻样本,耗时较长,不利于Web上实时在线分类等应用.提出了一种确定邻近区域来加快搜寻K个最近邻的方法.试验证明,改进后的KNN算法较经典KNN算法在分类过程中速度有所提升,并且当训练文本数量增加时,在分类时间上表现相对更稳定.
推荐文章
KNN文本分类算法研究
文本分类
KNN
向量空间模型
基于聚类降维的改进KNN文本分类
特征降维
聚类
文本分类
K平均
K近邻
一种改进的KNN Web文本分类方法
Web文本分类
K最近邻
快速分类
一种基于数据偏斜的改进KNN文本分类
特征选择
文本分类
改进KNN
相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 通过确定邻近区域改进KNN文本分类
来源期刊 计算机系统应用 学科 工学
关键词 文本分类 k-最近邻 邻近区域 相似度 kNN算法
年,卷(期) 2009,(11) 所属期刊栏目 研究开发
研究方向 页码范围 56-59
页数 4页 分类号 TP3
字数 3023字 语种 中文
DOI 10.3969/j.issn.1003-3254.2009.11.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 汪成亮 重庆大学计算机学院 64 655 13.0 21.0
5 张硕果 重庆大学计算机学院 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (183)
参考文献  (7)
节点文献
引证文献  (2)
同被引文献  (6)
二级引证文献  (0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(6)
  • 参考文献(0)
  • 二级参考文献(6)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(4)
  • 参考文献(2)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(3)
  • 参考文献(3)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
k-最近邻
邻近区域
相似度
kNN算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
相关基金
重庆市自然科学基金
英文译名:
官方网址:http://law.ddvip.com/law/2006-09/11584979384040.html
项目类型:重点项目
学科类型:
论文1v1指导