基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文以结构化查询语言(SQL)为研究对象,利用词袋(BoW)模型和词频-逆文档频率(TF-IDF)算法两种方法进行SQL语句向量化.文本向量化后,特征矩阵维数大大增加,很难在后面数据训练和预测中使用.为解决这个问题,对大量SQL注入攻击语句与用户正常输入的SQL语句进行研究分析,概括出28个特征关键词.同时,使用决策树、XGBoost和随机森林三个分类模型,对数据集进行模型训练及预测.实验结果表明:与词袋(BoW)模型相比,词频-逆文档频率(TF-IDF)算法的准确率、召回率、F分数、精确率均提高了10%左右.此外,ROC曲线也说明了该方法的有效性.
推荐文章
基于SimHash算法的SQL注入攻击检测方法
SQL注入
SimHash
白名单
防御体系
基于序列比对的SQL注入攻击检测方法
SQL注入
序列比对
攻击检测
SQL注入攻击全面预防办法及其应用
ASP
SQL Server
SQL注入攻击
IDS
入侵检测
Web环境下SQL注入攻击的检测与防御
系统安全
SQL Server
SQL注入攻击
IDS检测
DDL模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 机器学习在SQL注入攻击检测中的应用
来源期刊 河南科技 学科
关键词 TF-IDF SQL注入攻击 文本向量化 机器学习
年,卷(期) 2021,(8) 所属期刊栏目 信息技术|ELECTRONIC TECHNOLOGY
研究方向 页码范围 23-27
页数 5页 分类号 TP393.08
字数 语种 中文
DOI 10.3969/j.issn.1003-5168.2021.08.016
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (34)
共引文献  (20)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(6)
  • 参考文献(1)
  • 二级参考文献(5)
2017(4)
  • 参考文献(1)
  • 二级参考文献(3)
2018(3)
  • 参考文献(1)
  • 二级参考文献(2)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
TF-IDF
SQL注入攻击
文本向量化
机器学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
河南科技
旬刊
1003-5168
41-1081/T
16开
河南省郑州市
36-175
1976
chi
出版文献量(篇)
31576
总下载数(次)
98
总被引数(次)
44105
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导