基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对大量冗余数据带来的钓鱼网站检测准确率不够、误判率较高等问题,提出一种基于最大相关最小冗余(mRMR)和随机森林(RF)相结合的特征选择方法(mRMR-RF),并利用极端梯度提升(XGBoost)算法构建钓鱼网站检测模型.利用mRMR和RF算法分别对特征进行排序;综合两种特征排序得出最终的排序结果,并根据实验得出的最佳特征数选出XGBoost模型所需的最优特征子集;使用最优特征子集对XGBoost分类模型进行训练.实验结果表明,该方法相比其他分类方法可以提高钓鱼网站检测的准确率,具有实际意义.
推荐文章
基于特征选择与集成学习的钓鱼网站检测方法
钓鱼网站
随机森林
信息增益率
特征选择
基于改进随机森林算法的钓鱼网站检测方法研究
钓鱼检测
关联规则
特征分区
数据空间
钓鱼网站的鉴别方法与防范策略研究
钓鱼网站
网络安全
钓鱼邮件
反钓鱼
网络钓鱼网站的技术原理与抵御措施
网络钓鱼网站
黑客
安全防护
警惕性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于mRMR-RF特征选择和XGBoost模型的钓鱼网站检测
来源期刊 计算机应用与软件 学科 工学
关键词 特征选择 最大相关最小冗余 随机森林 XGBoost 钓鱼网站
年,卷(期) 2020,(9) 所属期刊栏目 安全技术
研究方向 页码范围 296-301
页数 6页 分类号 TP301.6
字数 4609字 语种 中文
DOI 10.3969/j.issn.1000-386x.2020.09.049
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 梁雪春 南京工业大学电气工程与控制科学学院 49 431 13.0 19.0
2 毕青松 南京工业大学电气工程与控制科学学院 1 0 0.0 0.0
3 陈舒期 南京工业大学电气工程与控制科学学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (34)
共引文献  (46)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(7)
  • 参考文献(4)
  • 二级参考文献(3)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(5)
  • 参考文献(2)
  • 二级参考文献(3)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
特征选择
最大相关最小冗余
随机森林
XGBoost
钓鱼网站
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导