基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在Spark集群环境下,通过Sparklyr调用MLib中的并行逻辑回归算法对大规模抵押贷款数据的训练集进行监督学习,使用R语言建立一个预测客户是否会如期归还贷款的逻辑回归分类模型.为了研究该模型的可信性以及获取效率,本文补充了伪判定系数、分类评价指标、测试集性能几个指标对模型可信性进行评价,并判定了模型的可信性.在获得了可信模型的基础上,实验结果表明:当数据量增加到一定阈值后,在集群环境下使用并行的算法获得逻辑回归分类模型的速度要优于对应的串行算法.
推荐文章
Spark数据倾斜问题研究
大数据
Spark
数据倾斜
数据处理
逻辑回归和人工神经网络模型在滑坡灾害空间预测中的应用
三峡库区
Logistic回归
人工神经网络
GIS
ROC曲线
随机利率下提前还贷的数学模型及实证分析
随机利率
数学模型
提前还贷
补偿金
基于HBase的多分类逻辑回归算法研究
块批量梯度下降
多分类
逻辑回归
大数据
HBase
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Spark集群中还贷问题的逻辑回归模型研究
来源期刊 武汉工程大学学报 学科 工学
关键词 Spark集群 逻辑回归 R语言 大数据
年,卷(期) 2020,(1) 所属期刊栏目 机电与信息工程
研究方向 页码范围 113-118
页数 6页 分类号 TP311
字数 5267字 语种 中文
DOI 10.19843/j.cnki.CN42-1779/TQ.201907020
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (79)
共引文献  (2022)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(9)
  • 参考文献(1)
  • 二级参考文献(8)
2012(10)
  • 参考文献(0)
  • 二级参考文献(10)
2013(7)
  • 参考文献(1)
  • 二级参考文献(6)
2014(17)
  • 参考文献(3)
  • 二级参考文献(14)
2015(12)
  • 参考文献(2)
  • 二级参考文献(10)
2016(1)
  • 参考文献(0)
  • 二级参考文献(1)
2017(5)
  • 参考文献(3)
  • 二级参考文献(2)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Spark集群
逻辑回归
R语言
大数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
武汉工程大学学报
双月刊
1674-2869
42-1779/TQ
大16开
武汉市江夏区流芳大道特1号,武汉工程大学流芳校区,西北区1号楼504学报编辑部收
1979
chi
出版文献量(篇)
3719
总下载数(次)
13
总被引数(次)
21485
论文1v1指导