基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对攻击者利用URL缩短服务导致仅依赖于URL特征的恶意网页检测失效的问题,及恶意网页检测中恶意与良性网页高度不均衡的问题,提出一种融合网页内容层次语义树特征的成本敏感学习的恶意网页检测方法.该方法通过构建网页内容链接层次语义树,提取基于语义树的特征,解决了URL缩短服务导致特征失效的问题;并通过构建成本敏感学习的检测模型,解决了数据类别不均衡的问题.实验结果表明,与现有的方法相比,提出的方法不仅能应对缩短服务的问题,还能在类别不均衡的恶意网页检测任务中表现出较低的漏报率2.1%和误报率3.3%.此外,在25万条无标签数据集上,该方法比反病毒工具VirusTotal的查全率提升了38.2%.
推荐文章
基于内容与链接特征的中文垃圾网页分类
网页作弊
搜索引擎
机器学习
基于链接信息的网页分类算法
网页分类
类别
K近邻方法
链接信息分类
基于网页结构与链接关系的中文文本分类方法
中文文本分类
HTML结构
链接关系
向量空间模型
基于链接的Web网页分类
链接挖掘
基于链接的分类
逻辑回归模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网页内容链接层次语义树的恶意网页检测方法
来源期刊 计算机工程与应用 学科 工学
关键词 恶意网页检测 缩短服务 链接层次语义树 成本敏感
年,卷(期) 2020,(11) 所属期刊栏目 网络、通信与安全
研究方向 页码范围 90-97
页数 8页 分类号 TP309
字数 6419字 语种 中文
DOI 10.3778/j.issn.1002-8331.1911-0132
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宋礼鹏 中北大学大数据学院大数据与网络安全研究所 21 42 4.0 5.0
2 陈本刚 中北大学大数据学院大数据与网络安全研究所 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (50)
共引文献  (33)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(12)
  • 参考文献(2)
  • 二级参考文献(10)
2014(7)
  • 参考文献(0)
  • 二级参考文献(7)
2015(5)
  • 参考文献(0)
  • 二级参考文献(5)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(4)
  • 参考文献(0)
  • 二级参考文献(4)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
恶意网页检测
缩短服务
链接层次语义树
成本敏感
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导