原文服务方: 计算机应用研究       
摘要:
互联网广告是一个具有上千亿元规模的市场,广告的点击率(CTR)是互联网广告投放效果的重要指标.在广告点击率预估模型中,特征提取是关键因素,特征的好坏直接影响到最终模型的效果.针对如何提高广告点击率预估效率问题,在Hadoop大数据平台环境中,提出了基于梯度提升决策树(gradient boost decisiontree,GBDT)模型的多维特征提取方法.该方法利用原始数据构建多维基础特征库,并将基础特征库中除ID类特征以外的其余特征输入GBDT模型进行特征刷选,得到高层特征,进一步进行分类.该方法的使用不仅减少了特征提取的人工成本和时间成本,也在很大程度上提升了模型的精度.
推荐文章
基于LDA的互联网广告点击率预测研究
计算广告
点击率
主题模型
因子分解机
基于平衡采样的轻量级广告点击率预估方法
广告点击率
机器学习
计算广告学
类别不平衡学习
基于LDA的互联网广告点击率预测研究
计算广告
点击率
主题模型
因子分解机
基于概率图模型的互联网广告点击率预测
计算广告
点击率
个性化推荐
贝叶斯网
概率推理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 互联网广告点击率预估模型中特征提取方法的研究与实现
来源期刊 计算机应用研究 学科
关键词 CTR预估 特征提取 互联网广告 Hadoop大数据平台 GBDT
年,卷(期) 2017,(2) 所属期刊栏目 算法研究探讨
研究方向 页码范围 334-338
页数 5页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.02.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 田嫦丽 北京工商大学计算机与信息工程学院 4 49 4.0 4.0
2 张珣 北京工商大学计算机与信息工程学院 14 74 4.0 8.0
3 潘博 北京工商大学计算机与信息工程学院 5 49 4.0 5.0
4 杨超 北京工商大学计算机与信息工程学院 10 113 5.0 10.0
5 许彦茹 北京工商大学计算机与信息工程学院 1 31 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (36)
参考文献  (6)
节点文献
引证文献  (31)
同被引文献  (61)
二级引证文献  (10)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(5)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(5)
  • 二级引证文献(0)
2017(5)
  • 引证文献(5)
  • 二级引证文献(0)
2018(13)
  • 引证文献(12)
  • 二级引证文献(1)
2019(20)
  • 引证文献(11)
  • 二级引证文献(9)
2020(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
CTR预估
特征提取
互联网广告
Hadoop大数据平台
GBDT
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导