监督神经网络是智能找矿预测领域的重要研究方向,然而使用有监督的深度学习进行找矿预测的一个主要瓶颈是缺乏训练样本。一个研究区通常仅有的十几个或更少的矿床和矿点不足以满足深度学习训练样本的要求。
针对上述问题,吉林大学地球科学学院薛林福教授团队的博士研究生丁可等将小样本深度学习模型引入到找矿预测中,提出和实现了一种基于孪生网络的有监督的深度学习找矿预测方法,在一定程度解决了训练样本不足的问题。
孪生网络是一种基于度量的元学习网络,元学习可以学会学习:即用过去的知识和经验来指导新任务的学习。与常规神经网络的不同是:孪生网络输入的是一对样本,能够通过衡量输入样本的相似性从新样本中自动发现泛化特征。该网络应用于矿产勘察领域进行找矿的主要步骤(图1)如下:
1.构建样本数据
将研究区已有地质、元素地球化学异常和航磁数据,利用不同插值方法将其归算成规则网格中的代表值,并对其进行网格化。
通过窗口滑动进行数据增强获取样本数据(图2),并采用卷积神经网络(CNN)提取窗口的数据特征,每个窗口的网格数据可看成一幅包括地质、化探、物探信息的多通道图像,再通过样本随机配对方式构建训练和验证样本数据集,进一步增强数据集。
对于孪生网络采用逐对训练,将会有平方级别对图像网格对来训练模型,这也让模型很难过拟合。孪生网络需要相同类的和不同类的配对都有且分布均衡。训练数据集和验证数据集都要包括相同类的图像对和不同类的图像对。
2.孪生网络构建
孪生网络(Siamese Network)的核心思想即通过两个权重相同、结构一致的神经网络提取在公共特征空间上两个输入样本的特征,在新的特征空间对这两个输入进行度量学习,使其得到任务需求的特征(图3)。
将两个相同的CNN作为数据输入的端口,同时对输入两个窗口单元的数据进行空间结构特征自动提取,挖掘矿床与数据特征间的非线性关系,并将包含已知矿床的窗口作为找矿预测类型,通过学习特征而建立孪生网络找矿预测模型。
3.模型训练与验证
将随机配对的训练样本数据对输入到模型中,采用不同参数和超参数(窗口大小,滑动步长等)对模型进行训练,再通过验证数据集选取最优预测模型。
对预测区网格通过滑动窗口方式进行预测,窗口滑动的步长可以设定为1、2…n。在找矿预测阶段将每个找矿窗口的特征与已知矿床窗口作为输入数据输入到训练好的模型中,通过比较有矿窗口和无矿窗口的相似度,筛选出具有相似或相同数据特征的网格区域,从而预测有利成矿远景区。
该方法经在河北张家口崇礼矿集区进行金矿找矿应用,并与证据权重法及卷积神经网络(CNN)模型的预测结果对比(图4)得出:(a)孪生网络模型的预测效果优于卷积神经网络(CNN)模型,明显优于证据权重(WOE)方法;(b)预测结果与研究区地质成矿特征及已知矿床高度吻合。
该项研究验证了孪生网络在智能找矿预测领域的可用性,拓展了解决样本数据不足问题的方法,可获得良好的找矿预测结果,具有广泛的推广应用价值。
上述研究成果已发表于国际地学权威期刊《Ore Geology Reviews》。
Ding, K., Xue, L., Ran, X., Wang, J., & Yan, Q. (2022). Siamese Network Based Prospecting Prediction Method: A case study from the Au deposit in the Chongli mineral concentrate area in Zhangjiakou, Hebei Province, China. Ore Geology Reviews, 105024. https://doi.org/https://doi.org/10.1016/j.oregeorev.2022.105024。项目资助:本研究受中国地质调查局矿产地质调查与找矿预测项目(DD20190159)资助。