基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前在识别钓鱼网站的研究中,对识别速度有着越来越高的需求,因此提出了一种基于混合特征选择模型的钓鱼网站快速识别方法.混合特征选择模型包含初次特征选择、二次特征选择和分类三个主要部分,使用信息增益、卡方检验相结合以及基于随机森林的递归特征消除算法建立了混合特征选择模型,并在模型中使用分布函数与梯度,获取最佳截断阈值,得到最优数据集,从而提高钓鱼网站识别的效率.实验数据表明,使用该混合特征选择模型进行特征筛选后的数据集,维度降低了79.2%,在分类精确度几乎不损失的情况下,降低了32%的分类时间复杂度,有效地提高了分类效率.另外,使用UCI机器学习库中的大型钓鱼数据集对该模型进行评价,分类精确率虽然损失1.7%,但数据集维度降低了70%,分类时间复杂度降低了41.1%.
推荐文章
基于特征选择与集成学习的钓鱼网站检测方法
钓鱼网站
随机森林
信息增益率
特征选择
基于改进随机森林算法的钓鱼网站检测方法研究
钓鱼检测
关联规则
特征分区
数据空间
钓鱼网站的鉴别方法与防范策略研究
钓鱼网站
网络安全
钓鱼邮件
反钓鱼
网络钓鱼网站的技术原理与抵御措施
网络钓鱼网站
黑客
安全防护
警惕性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特征选择模型的钓鱼网站快速识别方法
来源期刊 计算机技术与发展 学科
关键词 特征选择 信息增益 卡方检验 随机森林 递归特征消除
年,卷(期) 2021,(4) 所属期刊栏目 大数据分析与挖掘
研究方向 页码范围 40-45
页数 6页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1673-629X.2021.04.007
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (63)
共引文献  (11)
参考文献  (12)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(8)
  • 参考文献(0)
  • 二级参考文献(8)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(8)
  • 参考文献(1)
  • 二级参考文献(7)
2014(6)
  • 参考文献(0)
  • 二级参考文献(6)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2016(8)
  • 参考文献(1)
  • 二级参考文献(7)
2017(10)
  • 参考文献(1)
  • 二级参考文献(9)
2018(3)
  • 参考文献(1)
  • 二级参考文献(2)
2019(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
特征选择
信息增益
卡方检验
随机森林
递归特征消除
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导