基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前主要是通过基于URL(Uniform Resource Locator)、关键词、图片等网页内容为特征的机器学习方法进行不良网站检测.但是,不良网站制作者也会通过更换URL,避免常见不良关键词的使用,对搜索爬虫隐藏图片等做法来规避检测,这使得基于内容的检测方法会有漏检的情况.为了更准确的检测出此类网站,本文提出了注册、解析方面的相关特征,并通过最主流的机器学习方法构建了检测模型.用模型预测新数据集,结果证明,基于解析和注册特征的检测方法可以有效的在网站集合中检测出前文提到的不良网站,并且对于一般不良也依然能够准确识别.本次研究为不良网站的检测研究提供了又一思路.
推荐文章
基于参数化模型的多维度非线性景观设计方法
景观设计
参数化模型
参数模拟
区域重构
特征提取
仿真分析
基于多维度特征权值动态更新的用户推荐模型研究
多维度
电影推荐
权值动态更新
个性化推荐模型
基于特征选择与集成学习的钓鱼网站检测方法
钓鱼网站
随机森林
信息增益率
特征选择
基于多维度特征的饮食健康推荐
饮食
用户画像
饮食记录
即时情境
聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多维度特征的不良网站检测
来源期刊 计算机系统应用 学科
关键词 解析 注册 不良网站 检测
年,卷(期) 2017,(2) 所属期刊栏目 研究开发
研究方向 页码范围 207-211
页数 5页 分类号
字数 4427字 语种 中文
DOI 10.15888/j.cnki.csa.005597
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李晓东 中国互联网络信息中心互联网络域名管理技术国家工程实验室 14 142 6.0 11.0
2 延志伟 中国互联网络信息中心互联网络域名管理技术国家工程实验室 14 49 4.0 6.0
3 田双柱 1 1 1.0 1.0
12 陈勇 中国互联网络信息中心互联网络域名管理技术国家工程实验室 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (21)
参考文献  (8)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1983(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
解析
注册
不良网站
检测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导