基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统距离或相似度度量未考虑个体样本对整体样本集影响的情况,对 K 近邻算法提出了一种相似度改进策略。首先提出了一种新的亲和距离函数,以样本对整体样本集的紧密度和分散度为关注点;其次在亲和距离函数的基础上,提出了一种新的基于紧密度和分散度的亲和相似度函数,并将其作为 K 近邻算法相似度度量函数;最后通过理论分析及18个数值类型 UCI 数据集,以5交叉验证模式对所提出亲和相似度函数与传统距离和相似度函数进行验证对比。实验表明,所提出方法是一种有效的相似度策略,且与高效索引算法相结合,可降低在大规模数据集的分类时间。
推荐文章
K近邻相似度优化的密度峰聚类
聚类
密度峰
相似度
K近邻
基于用户紧密度的微博网络社区发现算法
社区发现
微博网络
GN 算法
用户紧密度
共有邻居相似度
基于用户紧密度的在线社会网络社区发现算法
在线社会网络
用户紧密度
节点属性相似性
共有邻居相似性
社区发现
层次聚类
一种基于共享近邻亲和度的聚类算法
聚类
密度
共享近邻
亲和度
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 结合紧密度和分散度的近邻亲和相似度函数
来源期刊 西安电子科技大学学报(自然科学版) 学科 工学
关键词 机器学习 近邻 亲和相似度 分散度 紧密度
年,卷(期) 2014,(3) 所属期刊栏目
研究方向 页码范围 123-130
页数 8页 分类号 TP301.6
字数 7190字 语种 中文
DOI 10.3969/j.issn.1001-2400.2014.03.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王宇平 西安电子科技大学计算机学院 128 1633 22.0 34.0
2 李娟 西安电子科技大学计算机学院 68 221 9.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (5)
参考文献  (9)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(4)
  • 参考文献(4)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
机器学习
近邻
亲和相似度
分散度
紧密度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安电子科技大学学报(自然科学版)
双月刊
1001-2400
61-1076/TN
西安市太白南路2号349信箱
chi
出版文献量(篇)
4652
总下载数(次)
5
总被引数(次)
38780
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导