原文服务方: 计算机应用研究       
摘要:
提出一种选择最富信息数据并予以标记的基于主动学习策略的半监督聚类算法.首先,采用传统K-均值聚类算法对数据集进行粗聚类;其次,根据粗聚类结果计算出每个数据隶属于每个类簇的隶属度,筛选出满足最大与次大隶属度差值小于阈值的候选数据,并从中选择差值较小的数据作为最富信息的数据进行标记;最后,将候选数据集合中未标记数据分组到与每类已被标记数据平均距离最小的类簇中.实验表明,提出的主动学习策略能够很好地学习到最富信息数据,基于该学习策略的半监督聚类算法在测试不同数据集时均获得了较高的准确率.
推荐文章
基于主动数据选取的半监督聚类算法
数据挖掘
半监督聚类
主动学习
标签数据
数据选取
最小生成树
多密度数据集
不平衡数据集
结合主动学习策略的半监督分类算法
半监督分类
主动学习
投票熵
样本密度
主动纠错式半监督聚类社区发现算法
主动学习
纠错式半监督社区发现
K-means算法
成对约束
基于半监督学习的K-均值聚类算法研究
半监督聚类
改进的K-均值算法
动态管理种群的粒子群算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于主动学习策略的半监督聚类算法研究
来源期刊 计算机应用研究 学科
关键词 K-均值算法 主动学习策略 半监督学习 聚类
年,卷(期) 2013,(6) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1718-1720
页数 3页 分类号 TP181|TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2013.06.030
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (122)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (4)
二级引证文献  (2)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(5)
  • 参考文献(3)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
K-均值算法
主动学习策略
半监督学习
聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导