基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
高维数据中许多特征之间互不相关或冗余,这给传统的学习算法带来了巨大的挑战.为了解决该问题,特征选择应运而生.与此同时,许多实际问题中数据存在多个视图而且数据的标签难以获取,多视图学习和半监督学习成为机器学习中的热点问题.本文研究怎样从“部分标签”的多视图数据中选择最大相关最小冗余的特征子集,提出一种基于多视图的半监督特征选择方法.为了剔除冗余和无关的特征,探索蕴含于多视图数据中的互补信息以及每个视图中不同特征之间的冗余关系,并利用少量标签数据蕴含的信息协同未标签数据同时进行特征选择.实验结果验证了本算法能够获得很好的特征选择效果及聚类效果.
推荐文章
基于主动数据选取的半监督聚类算法
数据挖掘
半监督聚类
主动学习
标签数据
数据选取
最小生成树
多密度数据集
不平衡数据集
一种基于变分贝叶斯的半监督双聚类算法
双聚类算法
变分贝叶斯
半监督学习
概率模型
一种基于特征聚类的特征选择方法
特征选择
特征聚类
相关度
无监督学习
一种面向聚类的加权特征选择算法
加权特征选择
聚类
信息熵
邻域分析
特征权值向量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于多视图数据的半监督特征选择和聚类算法
来源期刊 数据采集与处理 学科 工学
关键词 聚类 半监督 特征选择 多视图
年,卷(期) 2015,(1) 所属期刊栏目
研究方向 页码范围 106-116
页数 11页 分类号 TP181
字数 6104字 语种 中文
DOI 10.16337/j.1004-9037.2015.01.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐林莉 中国科学技术大学计算机科学与技术学院 3 12 1.0 3.0
2 汪荆琪 中国科学技术大学计算机科学与技术学院 1 11 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (5)
参考文献  (5)
节点文献
引证文献  (11)
同被引文献  (54)
二级引证文献  (31)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(8)
  • 引证文献(3)
  • 二级引证文献(5)
2017(10)
  • 引证文献(3)
  • 二级引证文献(7)
2018(15)
  • 引证文献(3)
  • 二级引证文献(12)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
聚类
半监督
特征选择
多视图
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导