基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术 . kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用 .但是这种方法计算量大,而且训练样本的分布不均匀会造成分类准确率的下降 .针对kNN方法存在的这两个问题,提出了一种基于密度的kNN分类器训练样本裁剪方法,这种方法不仅降低了kNN方法的计算量,而且使训练样本的分布密度趋于均匀,减少了边界点处测试样本的误判 .实验结果显示,这种方法具有很好的性能 .
推荐文章
文本分类中基于K-means的类偏斜KNN样本剪裁
K最近邻
类偏斜
样本剪裁
聚类
基于聚类降维的改进KNN文本分类
特征降维
聚类
文本分类
K平均
K近邻
一种改进的KNN Web文本分类方法
Web文本分类
K最近邻
快速分类
KNN文本分类算法研究
文本分类
KNN
向量空间模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于密度的kNN文本分类器训练样本裁剪方法
来源期刊 计算机研究与发展 学科 工学
关键词 文本分类 kNN 快速分类
年,卷(期) 2004,(4) 所属期刊栏目 人工智能
研究方向 页码范围 539-545
页数 7页 分类号 TP391|TP18
字数 5217字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡运发 复旦大学计算机与信息技术系 150 3430 27.0 54.0
2 李荣陆 复旦大学计算机与信息技术系 12 908 8.0 12.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (277)
同被引文献  (197)
二级引证文献  (1326)
1972(1)
  • 参考文献(1)
  • 二级参考文献(0)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2005(9)
  • 引证文献(4)
  • 二级引证文献(5)
2006(36)
  • 引证文献(16)
  • 二级引证文献(20)
2007(64)
  • 引证文献(28)
  • 二级引证文献(36)
2008(76)
  • 引证文献(28)
  • 二级引证文献(48)
2009(66)
  • 引证文献(21)
  • 二级引证文献(45)
2010(80)
  • 引证文献(23)
  • 二级引证文献(57)
2011(78)
  • 引证文献(22)
  • 二级引证文献(56)
2012(83)
  • 引证文献(18)
  • 二级引证文献(65)
2013(101)
  • 引证文献(18)
  • 二级引证文献(83)
2014(110)
  • 引证文献(17)
  • 二级引证文献(93)
2015(114)
  • 引证文献(22)
  • 二级引证文献(92)
2016(162)
  • 引证文献(17)
  • 二级引证文献(145)
2017(209)
  • 引证文献(16)
  • 二级引证文献(193)
2018(189)
  • 引证文献(15)
  • 二级引证文献(174)
2019(178)
  • 引证文献(11)
  • 二级引证文献(167)
2020(48)
  • 引证文献(1)
  • 二级引证文献(47)
研究主题发展历程
节点文献
文本分类
kNN
快速分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导