基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
[目的]针对材料科学工作者开展机器学习工作门槛较高这一现状,本文基于MatCloud研发一个用户友好、自动化的材料数据挖掘与机器学习模块Auto-Mat.[方法]本文对MatMiner和scikit-learn中一些已有的获取数据的方法和机器学习算法进行了集成,并定义了数据字典以读取不同材料计算数据库的数据.同时,自主研发了一些特征筛选和处理方面的算法.[结果]能够提供一个具有可视化交互和展示界面的材料数据挖掘与机器学习模块,并将数据以统一的格式呈现.同时,自主研发的算法,对模型的性能均有一定提升.[局限]对于数据的获取,目前仅仅能获取到通过MatMiner API中的数据,相关代码的编写也完全和MatMiner API保持同步,因此可扩展性较差.而且,目前一些核心算法的执行速度有待提升.[结论]通过该模块与MatCloud的集成,用户可以"一站式"地读取Materials Project等几个主流数据库中的数据,并快速构建属于自己的材料数据挖掘与机器学习工作流程.并在最后通过2个案例的对比分析,说明了该模块对于降低用户开展材料数据挖掘与机器学习的使用门槛有着积极作用.
推荐文章
数据挖掘方法与工具
数据挖掘
数据库
模型
预报模型
机器学习算法在数据挖掘中的应用
数据挖掘
BP 神经网络
遗传优化算法
空压机故障诊断
机器学习算法对旅游数据的挖掘应用
机器学习算法
数据挖掘
户外定位
基于三层模型的机器学习建模工具设计与实现
数据挖掘
机器学习
分层模型
建模工具
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 材料数据挖掘与机器学习工具的集成与优化
来源期刊 数据与计算发展前沿 学科
关键词 材料科学 数据挖掘 可视化交互界面 数据汇总 特征提取 模拟退火算法 MatCloud
年,卷(期) 2020,(4) 所属期刊栏目 技术与应用
研究方向 页码范围 105-120
页数 16页 分类号
字数 语种 中文
DOI 10.11871/jfdc.issn.2096-742X.2020.04.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨小渝 中国科学院计算机网络信息中心 17 40 4.0 6.0
2 董家源 中国科学院计算机网络信息中心 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (1)
参考文献  (17)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1957(1)
  • 参考文献(1)
  • 二级参考文献(0)
1983(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(4)
  • 参考文献(4)
  • 二级参考文献(0)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(1)
  • 参考文献(0)
  • 二级参考文献(1)
2020(1)
  • 参考文献(0)
  • 二级参考文献(1)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
材料科学
数据挖掘
可视化交互界面
数据汇总
特征提取
模拟退火算法
MatCloud
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据与计算发展前沿
双月刊
2096-742X
10-1649/TP
大16开
北京市海淀区中关村南四街4号
2-493
2008
chi
出版文献量(篇)
135
总下载数(次)
3
总被引数(次)
9
论文1v1指导