基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络作弊检测是搜索引擎的重要挑战之一,该文提出基于遗传规划的集成学习方法(简记为GPENL)来检测网络作弊.该方法首先通过欠抽样技术从原训练集中抽样得到t个不同的训练集;然后使用c个不同的分类算法对t个训练集进行训练得到t*c个基分类器;最后利用遗传规划得到t*c个基分类器的集成方式.新方法不仅将欠抽样技术和集成学习融合起来提高非平衡数据集的分类性能,还能方便地集成不同类型的基分类器.在WEBSPAM-UK2006数据集上所做的实验表明无论是同态集成还是异态集成,GPENL均能提高分类的性能,且异态集成比同态集成更加有效;GPENL比AdaBoost、Bagging、RandomForest、多数投票集成、EDKC算法和基于Prediction Spamicity的方法取得更高的F-度量值.
推荐文章
基于改进遗传算法的神经网络集成模型
遗传算法
神经网络集成
自适应交叉概率
自适应变异概率
基于遗传规划和主动学习的本体实例匹配
本体匹配
实例匹配
链接规则
遗传规划
主动学习
基于遗传神经网络的入侵检测
入侵检测
神经网络
遗传算法
网络安全
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于遗传规划集成学习的网络作弊检测
来源期刊 中文信息学报 学科 工学
关键词 网络作弊 集成学习 遗传规划 非平衡数据集分类
年,卷(期) 2012,(5) 所属期刊栏目
研究方向 页码范围 94-100
页数 分类号 TP391
字数 7317字 语种 中文
DOI 10.3969/j.issn.1003-0077.2012.05.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马军 山东大学计算机科学与技术学院 74 980 15.0 29.0
2 马少平 清华大学计算机科学与技术系 53 2381 23.0 48.0
3 牛小飞 山东大学计算机科学与技术学院 5 14 2.0 3.0
6 张冬梅 山东大学计算机科学与技术学院 12 46 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络作弊
集成学习
遗传规划
非平衡数据集分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导