摘要:
通过玄武岩判别图推断其所形成的大地构造环境的方法由来已久,自1971年Pearce提出了构造-岩浆判别图解法之后,已涌现出了几十种不同的判别图.然而,判别图的制作过程中使用的元素的信息量少,数据样本量少,缺乏代表性,以至于其适用范围有限,且准确率不够.为提高构造环境判别过程的效率和准确性,本文提出以大数据智能挖掘方法建立判别模型,通过玄武岩的化学成分,迅速准确地对其大地构造环境进行判别.所用到的玄武岩包括三类:洋中脊玄武岩(MORB)、洋岛玄武岩(OIB)和岛弧玄武岩(IAB),样品总量为755个.首先,本文分别利用主量元素判别图和微量元素判别图对三类数据的大地构造环境进行判别,包括TiO2-MnO-P2O5、FeOT-MgO-Al2O3、Ti-Zr-Y、Zr/Y-Zr和Ti-Zr判别图.由于判别图法针对的是特定的元素或化合物,而有些样品的成份记录不完善或没有测量到有指定物质,导致无法对该样品在判别图中绘制,因此在绘制不同的判别图之前,需要筛选掉一部分数据.判别结果表明,在不考虑无效数据的情况下,Zr/Y-Zr判别图的准确率最高,可达90%以上.但如果考虑到已筛选掉的数据,上述五种图对三种岩石的判别准确率均低于75%.在利用数据挖掘算法进行判别的过程中,本文分别试验了朴素贝叶斯(NB)、K邻近(KNN)、支持向量机(SVM)和随机森林(RF)四种算法.为达到较好的识别效果,本文将所有的化合物和微量元素组成51维的参数组用于训练模型,并且不会进行任何的数据筛选,即全部被视作有效数据.训练结果表明,NB的分类结果最差,但也超过了75%,而RF训练准确率高达100%.在算法的进阶分析中,测得RF算法验证准确率可达88.46%;为提升智能算法的实用性,本文利用贝叶斯定理对算法的判别结果求逆概率,以实现“由果及因”的合理推断;同时,本文通过人为模拟数据缺失,进一步验证不同的算法的鲁棒性,并认为RF和NB是应该被优先考虑的两种算法;最后,通过提取RF中的决策树,本文对样本中元素的重要性进行了分析,并找到了对判别效果影响最大的几个主量元素和微量元素.综上所述,利用数据挖掘算法判别大地构造环境要比判别图法更为准确、迅速且功能多样,可在该领域做进一步推广应用.