基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对流量分类中样本标注瓶颈和类不均衡问题,提出一种基于K均值和k近邻的半监督流量分类算法.采用K均值聚类算法将混有少量标记样本和大量未标记样本的数据聚成若干个簇,然后采用k近邻算法利用簇中标记样本对未标记样本进行分类.在分类过程中根据簇中标记样本分布调整参与分类的最近邻居数,从而克服了类不均衡对识别小类流的不利影响.理论分析和实验结果都表明,算法在面对非均衡协议流时提高了小类流的识别率.
推荐文章
基于半监督学习的K-均值聚类算法研究
半监督聚类
改进的K-均值算法
动态管理种群的粒子群算法
基于K近邻的众包数据分类算法
众包数据
质量控制
K近邻投票
多数投票
采用潜在概率语义模型和K近邻分类器的音频分类算法
梅尔频率倒谱系数
词-频共现矩阵
声音袋模型
潜在概率语义模型
K近邻分类器
基于局部均值分解和K近邻算法的滚动轴承故障诊断方法
滚动轴承
局部均值分解
K近邻算法
特征提取
故障诊断
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于K均值和k近邻的半监督流量分类算法
来源期刊 信息工程大学学报 学科 工学
关键词 流量分类 非均衡 半监督 K均值 k近邻
年,卷(期) 2015,(2) 所属期刊栏目 计算机技术及应用
研究方向 页码范围 234-239
页数 6页 分类号 TP393.06
字数 5353字 语种 中文
DOI 10.3969/j.issn.1671-0673.2015.02.019
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张效义 23 196 6.0 13.0
2 张霞 13 49 5.0 6.0
3 李青 16 62 4.0 7.0
4 李林林 3 14 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (159)
参考文献  (7)
节点文献
引证文献  (6)
同被引文献  (34)
二级引证文献  (13)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(4)
  • 参考文献(1)
  • 二级参考文献(3)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(9)
  • 参考文献(2)
  • 二级参考文献(7)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(11)
  • 引证文献(1)
  • 二级引证文献(10)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
流量分类
非均衡
半监督
K均值
k近邻
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息工程大学学报
双月刊
1671-0673
41-1196/N
大16开
郑州市科学大道62号
2000
chi
出版文献量(篇)
2792
总下载数(次)
2
总被引数(次)
9088
论文1v1指导