原文服务方: 计算机应用研究       
摘要:
随着数据量的增加,特征选择已经成为机器学习和数据挖掘领域的研究热点,提出一种基于最近最远邻的特征选择算法.一个数据点与其最近的邻点属于同一集群,与最远的邻点属于不同的集群,通过计算最近最远邻的特征距离可以得到一种判断特征重要性的指标;在此基础上运用互信息方法去除了特征之间的冗余;同时引入了Gradient boosting方法进行模型参数调优,提高了分类准确性.在UCI数据集上进行分类预测,结果表明该算法能够找到较优的特征子集,分类准确性得到一定提升.
推荐文章
基于模糊互信息的多标签特征选择
特征选择
互信息
模糊互信息
基于 Parzen 窗条件互信息计算的特征选择方法
特征选择
Parzen 窗
条件互信息
特征离散度
基于互信息的特征子集选择
数据挖掘
LV算法
特征子集选择
互信息
一种基于扩展互信息算法的特征选择方法
文本分类
特征选择
评价函数
互信息
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于最近最远邻和互信息的特征选择方法
来源期刊 计算机应用研究 学科
关键词 特征选择 最近最远邻 互信息 梯度下降
年,卷(期) 2017,(12) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3713-3716
页数 4页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.12.044
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘媛华 上海理工大学管理学院 49 128 7.0 9.0
2 吴雨 上海理工大学管理学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (66)
共引文献  (235)
参考文献  (8)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(5)
  • 参考文献(1)
  • 二级参考文献(4)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(5)
  • 参考文献(1)
  • 二级参考文献(4)
2005(6)
  • 参考文献(1)
  • 二级参考文献(5)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(9)
  • 参考文献(0)
  • 二级参考文献(9)
2011(7)
  • 参考文献(0)
  • 二级参考文献(7)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(6)
  • 参考文献(3)
  • 二级参考文献(3)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
特征选择
最近最远邻
互信息
梯度下降
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导