基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对网络中存在的对等网络(P2P)流量泛滥导致的流量失衡问题,提出将非平衡数据分类思想应用于流量识别过程.通过引入合成少数类过采样技术(SMOTE)算法并进行改进,提出了均值SMOTE(M-SMOTE)算法,实现对流量数据的平衡化处理.在此基础上分别采用3种机器学习分类器:随机森林(RF)、支持向量机(SVM)、反向传播神经网络(BPNN)对处理后各类流量进行识别.理论分析与仿真结果表明,在不影响P2P流量识别准确率的前提下,与非平衡状态相比,引入SMOTE算法将非P2P流量的识别准确率平均提高了16.5个百分点,将网络流量的整体识另别率提高了9.5个百分点;与SMOTE算法相比,M-SMOTE算法将非P2P流量的识别准确率与网络流量的整体识别率分别进一步提高了3.2个百分点和2.6个百分点.实验结果表明,非平衡数据分类思想可有效解决P2P流量过多导致的非P2P流量识别率低的问题,同时所提M-SMOTE算法具有更高的识别准确度.
推荐文章
网络流量分类与应用识别的研究
流量分类
应用识别
机器学习
无监督聚类
有监督分类
网络流量监测技术
流量监测
网络管理
流量信息
流量分析
基于有督导机器学习的网络流量识别系统
有督导机器学习
网络流量识别
LSSVM
协同量子粒子群优化算法
采用子网流量组合优化的网络流量分割方法
网络流量分割
数据包延迟
二次分配
子网流量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 非平衡网络流量识别方法
来源期刊 计算机应用 学科 工学
关键词 非平衡数据 P2P流量 流量识别 机器学习 合成少数类过采样技术算法
年,卷(期) 2018,(1) 所属期刊栏目 2017年全国开放式分布与并行计算学术年会(DPCS 2017)论文
研究方向 页码范围 20-25
页数 6页 分类号 TP393.02
字数 6886字 语种 中文
DOI 10.11772/j.issn.1001-9081.2017071812
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 韩国栋 33 166 7.0 11.0
2 王孝龙 6 17 3.0 4.0
3 黄雅静 2 7 1.0 2.0
4 燕昺昊 4 8 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (107)
共引文献  (62)
参考文献  (7)
节点文献
引证文献  (7)
同被引文献  (30)
二级引证文献  (3)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(7)
  • 参考文献(0)
  • 二级参考文献(7)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(8)
  • 参考文献(0)
  • 二级参考文献(8)
2009(11)
  • 参考文献(0)
  • 二级参考文献(11)
2010(10)
  • 参考文献(0)
  • 二级参考文献(10)
2011(7)
  • 参考文献(0)
  • 二级参考文献(7)
2012(7)
  • 参考文献(2)
  • 二级参考文献(5)
2013(13)
  • 参考文献(0)
  • 二级参考文献(13)
2014(14)
  • 参考文献(1)
  • 二级参考文献(13)
2015(11)
  • 参考文献(2)
  • 二级参考文献(9)
2016(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2018(4)
  • 参考文献(0)
  • 二级参考文献(1)
  • 引证文献(3)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(6)
  • 引证文献(4)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
非平衡数据
P2P流量
流量识别
机器学习
合成少数类过采样技术算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导