基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网高速发展的同时催生了众多恶意网页.恶意网页是指侵犯用户安全,包括个人隐私和财产等安全的网页.文中基于对若干恶意网页的传统网页特征:网页URL、JavaScript代码和HT-ML代码的分析,定义了若干特征用于恶意网页识别;提出了若干基于HTTP请求信息的特征;并提出了一个基于特征融合和机器学习的恶意网页识别方法,将HTTP请求特征与传统网页特征相融合,再利用机器学习分类算法构建网页分类模型区分正常和恶意网页.从Alexa选取500个正常网页,从PhishTank和Malwaredomains中共选取500个网页作为恶意网页构建数据集,训练网页分类模型.通过实验验证了基于URL特征、网页代码特征和HTTP请求特征的方法优于不使用HT-TP请求特征的方法,并且发现随机森林分类算法更适用于恶意网页识别.
推荐文章
基于多特征融合的恶意软件分类方案
数据安全与计算机安全
恶意软件分类
静态分析
多特征融合
集成学习
基于机器学习算法的Android恶意程序检测系统
随机森林
恶意代码检测
多类特征
安卓应用
机器学习
恶意代码分类的一种高维特征融合分析方法
恶意代码分类
特征提取
特征融合
深度特征处理
局部敏感哈希
基于模糊识别恶意代码检测技术的研究
模糊识别
恶意代码
支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特征融合和机器学习的恶意网页识别研究
来源期刊 南京邮电大学学报(自然科学版) 学科 工学
关键词 恶意网页 网页安全 网页特征 HTTP请求 机器学习
年,卷(期) 2019,(5) 所属期刊栏目 计算机与自动控制
研究方向 页码范围 95-104
页数 10页 分类号 TP393
字数 6666字 语种 中文
DOI 10.14132/j.cnki.1673-5439.2019.05.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 成卫青 南京邮电大学计算机学院 31 301 11.0 16.0
5 魏旭 南京邮电大学计算机学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (37)
共引文献  (49)
参考文献  (9)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(12)
  • 参考文献(2)
  • 二级参考文献(10)
2014(5)
  • 参考文献(1)
  • 二级参考文献(4)
2015(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(5)
  • 参考文献(2)
  • 二级参考文献(3)
2017(2)
  • 参考文献(1)
  • 二级参考文献(1)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
恶意网页
网页安全
网页特征
HTTP请求
机器学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京邮电大学学报(自然科学版)
双月刊
1673-5439
32-1772/TN
大16开
南京市亚芳新城区文苑路9号
1960
chi
出版文献量(篇)
2234
总下载数(次)
13
总被引数(次)
14649
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导