基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了调查机器学习相关主题分布和发展趋势,从在线问答网站Stack Overflow上,利用过滤标签,从4 178多万帖子中提取出60 028个与机器学习相关的问题帖. 通过分析问题帖,统计各个机器学习平台的讨论量,发现Scikit-learn、TensorFlow、Keras是前3位频繁被讨论的机器学习平台,占总讨论量的58%. 为了进一步分析机器学习相关讨论主题,进行潜在狄利克雷分布(LDA)主题模型训练,提出自适应LDA中的主题数渐进搜索方法,采用主题一致性系数评估输出结果,获得主题最佳数量,从而发现9个讨论主题,分属3个类别:代码相关、模型相关、理论相关. 基于主题中问题帖的浏览数、评论数,分析不同主题的流行度和回答困难程度.
推荐文章
大规模机器学习问题研究
机器学习
优化
大规模数据
在线
坐标优化
大规模风电接入电网的相关问题及解决措施
供电企业
风电接入电网
新能源
风力发电
大规模物流配送车辆调度问题研究
车辆调度
启发式
遗传算法
优化
考虑装卸频率的大规模车辆路径问题研究
大规模车辆路径问题
装卸频率
遗传算法
C-W节约算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Stack Overflow上机器学习相关问题的大规模实证研究
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 实证研究 机器学习 Stack Overflow 潜在狄利克雷分布(LDA) 主题一致性
年,卷(期) 2019,(5) 所属期刊栏目 计算机与控制工程
研究方向 页码范围 819-828
页数 10页 分类号 TP 311
字数 8236字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 万志远 浙江大学计算机科学与技术学院 3 8 1.0 2.0
2 苌程 浙江大学计算机科学与技术学院 2 19 1.0 2.0
3 乔林 21 12 2.0 3.0
4 周巧妮 8 3 1.0 1.0
5 陶嘉恒 浙江大学软件学院 1 0 0.0 0.0
6 梁家坤 浙江大学软件学院 1 0 0.0 0.0
7 才振功 浙江大学软件学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (3)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(4)
  • 参考文献(2)
  • 二级参考文献(2)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
实证研究
机器学习
Stack Overflow
潜在狄利克雷分布(LDA)
主题一致性
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导