基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对钓鱼URL常用的混淆技术,提出一种基于规则匹配和逻辑回归的钓鱼网页检测方法(RMLR).首先,使用针对违反URL命名标准及隐藏钓鱼目标词等混淆技术所构建的规则库对给定网页分类,若可判定其为钓鱼网址,则省略后续的特征提取及检测过程,以满足实时检测的需要.若未能直接判定为钓鱼网址,则提取该URL的相关特征,并使用逻辑回归分类器进行二次检测,以提升检测的适应性和准确率,并降低因规则库规模不足导致的误报率.同时,RMLR引入基于字符串相似度的Jaccard随机域名识别方法来辅助检测钓鱼URL.实验结果表明, RMLR准确率达到98.7%,具有良好的检测效果.
推荐文章
基于改进随机森林算法的钓鱼网站检测方法研究
钓鱼检测
关联规则
特征分区
数据空间
基于特征选择与集成学习的钓鱼网站检测方法
钓鱼网站
随机森林
信息增益率
特征选择
钓鱼网站的鉴别方法与防范策略研究
钓鱼网站
网络安全
钓鱼邮件
反钓鱼
网络钓鱼网站的技术原理与抵御措施
网络钓鱼网站
黑客
安全防护
警惕性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于URL混淆技术识别的钓鱼网页检测方法
来源期刊 计算机工程与应用 学科 工学
关键词 钓鱼网页 统一资源定位符(URL)混淆技术 规则匹配 机器学习
年,卷(期) 2017,(20) 所属期刊栏目 网络、通信与安全
研究方向 页码范围 75-82
页数 8页 分类号 TP393.08
字数 8931字 语种 中文
DOI 10.3778/j.issn.1002-8331.1704-0480
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 努尔布力 新疆大学信息科学与工程学院 33 124 6.0 9.0
2 丁岩 新疆大学信息科学与工程学院 2 9 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (18)
参考文献  (8)
节点文献
引证文献  (6)
同被引文献  (8)
二级引证文献  (6)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(5)
  • 参考文献(1)
  • 二级参考文献(4)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(6)
  • 参考文献(2)
  • 二级参考文献(4)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(6)
  • 引证文献(2)
  • 二级引证文献(4)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
钓鱼网页
统一资源定位符(URL)混淆技术
规则匹配
机器学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导