您的当前位置:首页基于随机森林的四川省会理地区“拉拉式”铜矿成矿预测

基于随机森林的四川省会理地区“拉拉式”铜矿成矿预测

来源:飒榕旅游知识分享网
第56卷第2期2020年3月地质与勘探GEOLOGY AND EXPLORATIONVol. 56 No. 2March ,2020「金為矿产(doi: 10.12134/j. dzykt. 2020.02.001基于随机森林的四川省会理地区“拉拉式”

铜矿成矿预测张士红▽,肖克炎1(1.中国地质科学院矿产资源研究所,自然资源部成矿作用与资源评价重点实验室,北京100037;2.中国

地质大学(北京),北京100083)[摘要]四川省会理-会东矿集区是我国著名的铜资源基地。近年来,随着找矿勘查工作的深

入,又提交了多处大中型铜矿床,表明该地区仍具有较大的找矿潜力。本文基于获取的地质、化探和物

探数据,应用随机森林(Random Forest,RF)方法,在研究区开展“拉拉式”铜矿成矿潜力预测,取得了较

好的效果:随机森林模型预测的平均袋外误差率为6. 25% ,受试者工作特征曲线(Receiver Operating

Characteristic Curve,ROC)的 AUC 值为 0. 938。利用偏依赖图(Partial Dependence Plot,PDP)分析解释了

预测变量与已知矿床(点)的响应关系,按平均精度下降法排序预测要素的重要性,对“拉拉式”矿床的

找矿预测工作具有重要意义的前4个变量依次为:Cu元素含量,中-晚元古代(超)基性岩体临近度,Ni 元素含量和PC2因子得分。从成矿地质条件角度分析,河口群地层无疑是“拉拉式”铜矿的重要找矿预 测要素,但在随机森林模型中的重要性排序相对靠后。究其原因,一方面是与其它连续数值型预测要素

不同,河口群地层是二值(0~1)变量;另外,河口群地层的分布范围受覆盖层的影响较大。根据随机森

林模型生成的拉拉地区成矿有利度信息,圈定了 6处找矿远景区。红铜山-落西-红泥坡-姜驿高成

矿有利度区带呈北北东向展布,主体上与研究区内重要的地质-地球化学-地球物理预测要素异常空

间分布一致;其中蒿枝坝-落曲-红泥坡-姑鲁迷找矿远景区是本区已探明铜矿的主要分布区,其内还

有进一步勘探的潜力;同时,该异常区呈半环形态,结合地质勘探揭示的变质火山岩厚度分布,及其西部 受一组后期北北东向走滑断裂限制的特点,显示出古火山活动中心在西部,并可能存在被切割分离的另 一半环异常,这为该地区后续地质研究和铜矿勘查指明了方向。[关键词] 随机森林 成矿预测 成分数据 受试者工作特征曲线(ROC) 拉拉铜矿 会理地

区四川[中图分类号]P618 [文献标识码]A [文章编号]0495 -5331( 2020)02-14Zhang Shihong, Xiao Keyan. Random forest - based mineralization prediction of the Lala - type Cu

deposit in the Huili area, Sichuan Province [J]. Geology and Exploration ,2020,56(2) :0239 - 0252.0引言矿产资源预测是矿产勘查的重要组成部分,旨 在典型矿床研究的基础上,分析、集成地质、矿产、地

方法和数据驱动方法(Carranza,2011 ) o知识驱动 方法适用于勘查程度较低的地区,勘查区内往往没 有或者仅有极少数的已知矿床,主观的专家知识

(即对成矿作用过程的认识)对成矿预测具有决定 性意义。数据驱动方法则是在地质认识的基础上, 定量分析预测要素和已知矿(床)点的相关关系,建

球物理、地球化学、遥感等多元信息,实现研究区内

未发现矿产资源远景区的圈定和筛选,进一步指导

找矿勘查工作(Bonham - Carter, 1994; Porwal and 立数学模型进行矿产预测。数据驱动方法更适用于

Carranza,2015)o矿产预测方法可以分为知识驱动勘查程度较高,且区内分布有多个目标类型矿床的

[收稿日期]2019 -09 -14;[改回日期]2019 -11 -28;[责任编辑]陈伟军。[基金项目]国家重点研发计划项目(编号:2017YFC0601500、2017YFC0601501)资助。[第一作者]张士红(1987年-),女,在读博士生,主要研究方向为地球探测与信息技术、矿床储量计算与数值模拟、矿产资源预测与评价

研究 o E-mail: shzhang@ outlook. comQ[通讯作者]肖克炎(1963年-),男,博士,研究员,主要研究方向为数学地质与矿产资源评价研究。E-mail :kyanxiao@ sohu. com0239

地质与勘探2020 年地区。常用的成矿预测数学模型包括证据权模型及

其扩展模型(Agterberg, 1992 ;徐善法等,2006;毛先 成等,2013 ; Cheng ,2015),逻辑回归(Chung ,1978 ;

Harris et al. ,2003),层次分析法(何珊等,2018),人 工神经网络(Singer and Kouda, 1997 ;Harris and Pan,

1999),支持向量机(Zuo and Carranza,2011)和极限

学习机(Chen and Wu,2017)等。此外,鉴于深度学

习技术强大的特征表示能力,近年来已有众多学者 尝试将其引入到勘查地球化学异常识别和成矿预测 领域(Xiong and Zuo,2016; Xiong et al. ,2018 ;刘艳 鹏等,2018)。随机森林(Random Forest,RF)以其对多元共线

性不敏感,能处理高维数据和缺失值,对异常值和噪 声容忍度好,不容易出现过拟合和预测精度高等优

点,是目前被众多领域广泛应用的集成算法之一

(Cracknell and Reading,2014;张雷等,2014;Rahmati

et al. ,2016;李欣海,2019)。诸多学者亦对随机森 林在成矿预测领域的应用展开了探索,证明了随机 森林的精度和预测性能的优越性(Rodriguez -

Galiano et al. ,2014 ; Carranza and Laborte ,2015 ; Mck-

ay and Harris,2016;Zhang et al. ,2018),同时指出随

机森林模型对于缺失值和小训练样本集(<20个) 同样具有较好的处理和预测效果。四川省会理矿集区位于我国川滇近南北向的铜

铁多金属成矿带,自早元古代以来,经历了漫长的地 质演化及多期次且具有继承性的长期构造活动,成 矿地质背景优越。近年来,研究区内开展的铜矿接

替资源勘查项目取得了良好的找矿进展,提交了落

凶和红泥坡2处大型铜矿床和多处中型铜矿床,表 明研究区深部和外围(新地层)覆盖区仍有较大的

找矿潜力。本文应用随机森林算法定量分析了与拉 拉式铜矿关系密切的预测变量,利用接受者操作特 征曲线对预测模型的效果进行评价,完成了会理地

区“拉拉式”铜矿成矿潜力预测。1地质背景和矿床地质特征1. 1地质背景研究区位于中国四川省会理县境内,在大地构

造背景上处于东西向会理-东川坳拉槽西端,该拗 拉槽是扬子陆块西缘的南北向川滇被动大陆边缘裂

谷系的组成部分之一(图1,曾忻耕和田竞亚,1987 ; 何德锋等,2010)。区内地层自元古宇至新生界各 时代地层均有分布,以早-中元古界变质岩系和三

叠-白垩系陆相沉积为主,其它时代的地层零星分240102°EOxO2612图1 康滇地区地质简图(据Chen and Zhou,2012修改)Fig. 1 Simplified geological map of the Kangdian region

(modified from Chen and Zhou,2012)1-中元古代会理群;2 -中元古代昆阳群;3 -中元古代苴林群;4 -

中元古代东川群;5 -早元古代大红山群;6 -早元古代河口群;7 -花 岗岩;8 -闪长岩;9 -辉长岩;10 -铁、铜矿床;11-断层及推测断层;12-工作区位置1 - Mesoproterozoic Huili Group ; 2 - Mesoproterozoic Kunyang Group ;

3 - Mesoproterozoic Julin Group ; 4 - Mesoproterozoic Dongchuan Group ; 5 - Paleoproterozoic Dahongshan Group ; 6 - Paleoproterozoic Hekou

Group;7 - granite; 8 - diorite; 9 - gabbro; 10 - iron - copper deposit;11 - fault and inferred fault; 12 - study area布(图2)。早元古界康定群片麻岩系为该区变质结

晶基底,河口群为一套海相火山-沉积变质岩系,原 岩为一套富钠质的细碧-角斑岩系的熔岩、火山碎

屑岩和正常沉积建造组合。中元古界会理群岩性为第2期张士红等:基于随机森林的四川省会理地区“拉拉式”铜矿成矿预测N0101°50'E102°00'EZ0 9Z

N-0zo9e'广・」/ i亲j\\//p村V

7IN0I0 9Z

N-0IO9ZN00O9Z

101°50'E102°00'E123457891011o图2拉拉地区地质图®®Fig. 2 Simplified geological map of the Lala district®®1 -新生代;2 -中生代;3 -古生代;4 -晚元古代;5 -中元古代会理

群;6 -中元古代东川群;7-早元古代河口群;8 -早元古代康定群;

9 -酸性冲酸性侵入岩;10 -基性、超基性侵入岩;11 -断层;12 -铜

矿床(点)1 — Cenozoic;2 - Mesozoic;3 - Paleozoic;4 - Neoproterozoic;5 — Meso- proterozoic Huili Group ;6 - Mesoproterozoic Dongchuan Group ;7 - Paleo- proterozoic Hekou Group ; 8 - Paleoproterozoic Kangding Group ; 9 - acid

and intennediate - acid intrusion ; 10 - basic and ultrabasic intrusion ;11 - fault;12 - copper deposit(occurrence)浅变质细碎屑岩、变碳酸盐岩夹少量变质火山岩及火 山碎屑 岩(Greentree and Li, 2008 ; Zhao and Zhou,

2011,Chen et al. ,2013)。区内岩浆活动强烈,总体上 包括晋宁和华力西-印支两大构造岩浆旋回。岩类 包括河口群钠质细碧角斑岩、中元古代晩期至新元古

代的辉绿-辉长岩和花岗岩。区域内较晚形成的南 北向构造体系叠加在早期形成的近东西向构造体系 之上,形成双层构造格局。近东西走向构造体系主要

受晋宁期的南北向挤压作用的影响,表现为近东西走

向的基底褶皱和压性断裂。震旦纪以来,南北向构造 体系逐渐占据优势,形成一系列南北向主干断裂及伴

生次级断裂,少见完整的褶皱(周家云等,2008)。研究区是川滇南北向铜多金属成矿带的一部分(图]和

图2),分布着众多铜、铅、锌、铁、金、镰等矿床(点), 具有较大的找矿潜力,目前已经探获包括拉拉和红泥 坡矿床在内的多处铁、铜多金属大型矿床。1.2典型矿床特征落曲和红泥坡铜矿床是研究区内两处大型的海 相火山沉积-变质型矿床。矿体严格受层位和岩性 控制。红泥坡铜矿矿体位于河口群上部天生坝组火

山沉积旋回下部,落曲铜矿矿体赋存于河口群中部

落函组火山沉积旋回上部(图3)。矿体一般呈似层

状、透镜状产出,其产状与围岩基本一致(陈伯茂,

1981 )o含矿岩石主要为黑云(二云)石英片岩和石 英钠长岩,原岩为细碧角斑岩系。近年来在河口群 下部白云山组的白云质大理岩中发现了具有一定规 模的铜矿化,代表性矿床为白云山铜矿,该类型矿床

可能是氧化流体淋滤河口群火山岩中的铜金属后经 还原沉淀形成(罗丽萍等,2015)。构造位置上,落

函铜矿的矿体位于近东西向河口复式背斜的南翼,

靠近背斜核部。红泥坡铜矿矿体产于宽缓的、轴向火山旋回岩性地层(组)回尷黑V V V V V

天生坝组好

V XZ V X/ V V XZH—IM黠-,新桥组落凶组期罔鰹

大团簣组小铜厂组翱

m也

-K白云山组图3简化河口群地层柱状图(据Chen and Zhou,2012修改)

Fig. 3 Simplified stratigraphic chart of the Hekou Group

(modified from Chen and Zhou,2012)1-片岩、板岩;2 -大理岩;3 -变质砂岩;4 -石英钠长岩;5 -辉长

岩;6 -矿体1 - schist and slate ; 2 - marble ; 3 - meta - sandstone ; 4 - albitite ; 5 -

gabbro;6 - ore body241地质与勘探2020 年近东西的红泥坡复向斜中。主要的围岩蚀变有黑云 母化,其次是磁铁矿化、硅化、铁白云石化等。拉拉铜矿床的形成主要经历了火山喷发-沉积 成矿和热液改造成矿2个期次(Chen and Zhou,

2012;王奖臻等,2012; Min et al. ,2018)。早元古代

时期(1700 Ma),康滇古陆边缘发生裂解,在研究区

形成富含成矿物质的河口群海相火山喷发-沉积建

造,是为初始的矿(源)层。中元古代晚期 (1000 Ma),伴随晋宁造山运动的热事件使河口群 地层发生变形变质,变质热液流体淋滤萃取早期赋 矿地层中的铜、铝、金等金属元素,形成含矿流体,并

沿早期片理方向发生沉淀富集,是为变质热液改造 成矿期;中-晚元古代时期(800 Ma),来自地幔深 部的(超)基性岩浆的侵位,所携带的能量和流体造

成大范围的区域和热动力变质作用,也促使成矿物

质的进一步活化迁移和富集,是为岩浆热液改造成

矿期。从成矿系统(McCuaig et al. ,2010)的角度分

析,区内早元古代河口群地层为铜成矿提供物质来 源和矿体的就位空间。中晚元古代(超)基性岩浆

-热液活动提供流体和热源,促使成矿物质的活化 再富集成矿,在有辉长岩侵入的河口群地层中,辉长 岩体附近地层及其深部有较大的找矿潜力。因此

(超)基性侵入岩体和河口群地层是拉拉式铜矿的 重要找矿标志。2方法和数据2.1数据预处理2. 1. 1目标变量随机森林属于机器学习中一种监督学习算法,

即从给定的训练数据集中学习到一个最优的模型,

再利用这个模型将新的输入映射为相应的输出,以

达到分类或者回归的预测目的。监督学习的训练集

要求包括输入(预测变量)和输出(目标变量)标识。

对于有或无、发生或不发生等二分类问题,实质上是 对目标变量作两个分类(0~1)水平的判别。对于 成矿预测来说,就是指有矿和无矿两类,并分别用1

和0表示。研究区内分布的铜矿床类型主要为海相 火山沉积变质型,已勘查发现铜矿床(点)16处,其

中包括落述I和红泥坡大型铜矿床2处,老羊汗滩沟 中型铜矿床1处,石龙等小型铜矿床3处,以及其它

铜矿(点)8处(图2)。根据“罕见事件”(成矿事

件)的回归分析最优原则(Breslow and Cain, 1988 ; Schill et al. ,1993),选取16个与矿床(点)同样数量

242的非矿点作为随机森林的训练样本,结合成(控)矿

条件的分布特征,非矿点的位置选择要尽量确保拉 拉式铜矿的成矿可能性最小且随机均匀分布于研究

区内。相对于成矿异常事件往往集中分布于极为有

限的区域内,无矿则是一个普遍存在的大多数事件, 因此非矿单元要尽可能均匀的随机分布在整个研究 区范围内。为了开展空间数据分析工作,综合考虑数据和矿 床(点)的空间分布特征,将研究区划分为100 mx

100 m的网格数据,网格化后研究区划分92500个

单元,每个单元内最多只包含一个已知矿床(点)O2. 1.2预测变量(1) 地质要素为了定量分析地质要素与已知矿化单元的空间 分布关系,需要对预测要素进行分类或数值化处理, 实现定性的地质非结构化数据向定量的结构化数据 转换。河口群地层对铜成矿具有控制作用,将其作

0 ~1二值化栅格处理,其中河口群地层存在的位置 赋值为],河口群地层不存在则赋值为0。同时生成

(超)基性岩体的欧氏距离临近度图层,用于分析岩 体分布缓冲区范围对成矿作用的影响(图4) 0(2) 水系沉积物地球化学数据研究地球化学元素分布模式是矿产勘查的重要 手段,主要包括单元素地球化学异常分析和元素组 合异常分析两个方面。本研究中使用的1 : 50000

地质矿产图和水系沉积物地球化学数据来源于四川

省地矿局403地质队。水系沉积物样品共计4094 件,各样品包括 Ag、As、Au、Bi、Ce、Co、Cu、Mn、Mo、

Ni、Pb、Sb、Sn、W、Zn共15种微量元素含量的测试

结果,元素含量单位Au为xlO-9,其它为xl0_6o经典统计分析表明,研究区水系沉积物地球化 学元素含量数据基本服从对数正态分布。依据测区

水系沉积物元素含量的富集系数(K)和变异系数

(G)分析区内元素分布特征和富集规律。富集系 数为研究区元素平均含量(云)与全国水系沉积物平 均含量(任天祥等,1998)的比值,变异系数为元素

含量的标准偏差与均值之比,反映了元素分布均匀

性,是判断区域成矿潜力的重要指标。由表1可知, 研究区内Ce、Co、Cu、Mn、Mo、Ni元素的富集系数均

大于1- 00,表明这些元素相较于全国为富集特征, 有利于成矿;Ag、As、Au、Bi、Pb、Sb、Sn、W、Zn 元素的

富集系数小于1. 00,表明这些元素在拉拉地区趋于 贫化,成矿作用相对较弱。第2期张士红等:基于随机森林的四川省会理地区“拉拉式”铜矿成矿预测N高低0 15 km基性岩体临近度

distance to mafic intrusions

航磁化极

aeromagnetic intensity map图4拉拉式铜矿预测要素图Fig. 4 Predictive variables for Lala - type copper deposit表1拉拉地区水系沉积物地球化学元素特征参数Table 1 Parameters of geochemical elements in stream sediments of Lala district元素AgX0. 079. 12G1.142. 13K元素MoXG

1.570. 98K0. 770. 691.2543. 771. 111.530.65AbAuNiPbSbSn1.81.530. 890.4219. 340. 750. 830. 99BiCeCoCuMn0.3582.6520.3546. 850. 670. 530. 850. 620.510. 661.073. 521.690.711.551.83W0. 540. 55

1.321.28Zn69. 640.9864.711.19243地质与勘探2020 年由于成矿过程的复杂性和元素化学性质的差异 性,地球化学元素在空间上往往表现出共生组合特

征,因此地球化学元素的组合异常识别及其空间分 布特征研究,对于区域找矿同样具有重要意义。由

于地球化学元素数据属于成分数据(Aitchison,

1986),在对成分数据相关性分析之前有必要对其 进行对数比变换处理,以打开数据的闭合效应,去除 可能存在的数据伪相关性(Egozcue et al. , 2003 ;

Filzmoser et al. ,2009)。本文在对原始数据进行等

距对数 比变换(Isometric LogRatio transformation,

ILR)基础上,利用R型聚类分析和主成分分析方法 研究变量之间的共生组合和成因联系。在R聚类分析图中(图5),15种元素可分3个

大的组合。皮尔逊相关系数0.6

0.5 0.4 0.3 0.2 0.1 0 -0.1 -0.2ASsbMOcesn*

Biw识pbAgcoMnznsNiAU 图5拉拉地区水系沉积物元素R型聚类分析谱系图

Fig. 5 R - type cluster analysis of geochemical elements of

stream sediments in Lala district第一大类是Co、Mn、Zn、Cu、Ni、Au元素组合, 这是本区的成矿元素组合,其中Cu、Co、Au、Ni在本 区矿石中表现为强烈富集特征。该组合以亲铁元素

为主,其异常分布与出露的古元古界河口群地层、 (超)基性岩体在空间上具有很好的相关性,与区内

早元古代火山喷发和晋宁期(超)基性岩浆侵入活 动及其所表征的深部地幔上涌大地构造背景具有内 在的成生联系。第二大类为Ce、Sn、Bi、W、Pb、Ag组合,该元素

组合在本区表现为偏低-弱富集,其异常分布对岩 石地层并无显著的空间选择性,一些偏高异常通 常能够延伸到中-新生代沉积盖层区,这可能与

W、Sn等元素易于形成水系沉积物重砂矿物异常 有关。第三类是As、Sb、Mo元素组合,本区As、Sb贫 化,M。弱富集,其异常分布在空间上与第一类元素 有部分一致性,特别是Mo元素,也是铜矿石中回收

244的伴生元素之一。主成分分析因子载荷双标图(图6)显示,在第

一主分量(PC1)上Mn、Co表现为负高因子载荷,

As、Sb表现为正高因子载荷。在第二主分量(PC2)

中Cu、Mo、As表现为负高因子载荷,Sn、Ce、W、Pb

表现为正高因子载荷,经反转变换的PC2主分量的 高异常范围具有近矿指示意义。同时可以看出主成 矿元素Gu与Au、Ni、Mo、Co相关性较强,而与其它

元素相关性较弱或不相关,与该区成矿特征相符,这

些元素的局部富集是区域成矿的重要表征。-20

0

20 40QudE^押门蛛

-0.05

0 0.05第一主成分(PC1)图6地球化学元素主成分载荷双标图Fig. 6 Biplot of the principal components of geochemical

elements为了后续的空间统计分析和成矿预测工作,将

主分量因子得分和经过对数变换的原始元素含量数 值利用距离反比加权法(Inverse Distance Weighted,

IDW)生成100 m x 100 m的栅格数据,距离指数为

2(图 4)。(3)1 : 50000区域航磁数据首先对1 :50000比例尺的航磁数据进行100 mx

100 m网格化插值及化极处理,以减小或消除由于

斜磁化而引起的多数局部正负异常伴生现象,使

异常带及梯度带更加明显,有利于揭示磁性地质

体的性质和分布形态。拉拉地区的高磁异常呈北

北东向分布于白云山-落曲-红泥坡-姜驿一 带,异常与前震旦系河口群地层的分布大致吻合 (图4),主要是由磁铁矿或富含铁质的石英钠长 岩所引起。航磁异常特征基本反映了变钠质火山 岩的分布特征,对于揭示隐伏的河口群火山岩地

层具有重要意义。根据“拉拉式”铜矿典型矿床成矿地质分析,以第2期张士红等:基于随机森林的四川省会理地区“拉拉式”铜矿成矿预测及研究区水系沉积物地球化学元素和航磁数据的分

布特征,选择河口群地层、基性岩体临近度图层、

Cu、Au、Ni、Mo、Co元素含量对数值、第二主分量

(PC2)和航磁化极异常图共9个图层作为“拉拉式” 铜矿的输入预测变量。2.2随机森林方法原理随机森林是一种基于数据驱动的非参数机器学 习方法,结合了分类回归决策树和并行集成算法

(Breiman, 1996,2001) 0随机森林的建模过程首先 从原始样本集中通过bootstrap自助重采样技术有放

回地随机抽取”个与原样本集样本数量同样大小的 训练样本集。如果样本足够大,每个训练集中约有

1/3的原始数据未被抽取(Liaw,2012),称为袋外 (Outof Bag,00B)数据,00B数据不参与分类回

归树的训练,可以用来评估模型的错误率。随后

分别为每个训练样本集建立决策树,即产生由“

棵CART决策树组成的森林。在每棵树生长过程 中,从全部M个预测变量中随机抽选个

属性,根据基尼系数(Gini Index)最小原则选出最

佳属性用于节点分支,然后再重复递归调用上述 过程构造各个分枝,直到这棵树能准确地分类训 练样本集或者所有属性都已被使用过。最后利用

训练好的模型对新的待分类样本进行预测时,集 合n棵决策树的算术平均值作为最终的回归模型 输出。2.3随机森林建模在随机森林建模过程中,决策树的数量 (ntrees)和每个节点用来二分数据的预测变量的个 数(mtry)是对模型预测的袋外误差具有重要意义的 两个自定义参数(Breiman,2001)。决策树数量的增

加会使袋外误差逐渐收敛,但是过大的决策树数量 会使得模型的构建时间花费过大,并导致森林的可

解释性减弱。而随机变量个数的减少会同时降低决 策树的分类强度和相关性,降低树的分类强度则会

增加整个森林的误差,而降低分类树间的相关性则 可以减少森林的误差(Liaw and Winener,2002;张雷

等,2014)。因此ntrees和mtry值必须最佳化以获 得具有最优性能的随机森林预测模型。本文利用R 语言Random Forest程序包进行随机森林模型的构 建,经过多次测试,9个预测变量中,当每次二叉树

节点分割均随机指定3个变量,袋外误差最小 (图7 );在决策树等于400左右时,模型误差基本稳 定(图8)。Fig. 8 Model errors versus number of decision trees3结果与讨论3.1预测变量与已知矿床(点)的相关性分析

随机森林建模尽管被认为是_种“黑箱模型”, 但随机森林可以根据袋外数据误差和基尼系数衡量

预测变量的重要性,并利用偏依赖图可视化分析解 释各预测变量与目标变量之间的响应关系。利用随 机森林模型构建过程中预留的袋外数据,在保持其

它变量不变的情况下,对特定自变量值进行随机的 序列改变后带入预测模型,构建因变量与自变量的

偏依赖图,通过计算自变量扰动后预测精度的降低

程度(Mean Decrease Accuracy)对自变量进行重要 性排序。此外也可以利用基尼系数降低程度(Mean

Decrease Gini)即自变量扰动前后分裂节点不纯度 的平均降低程度为测度,来比较变量的重要性(Li­

aw,2012; 李欣海,2013)。随机森林建模给出的预测变量重要性估计表明 (图9),对“拉拉式”铜矿床的找矿预测具有重要意 义的前4个变量依次为:Cu元素含量,中-晚元古

代(超)基性岩体临近度,Ni元素含量和PC2因子得 分。总体上,利用预测精度的降低程度和基尼不纯

245地质与勘探2020 年度降低程度两种方法得到的主要的预测要素重要性 一致,仅排序靠后的几个要素略有差异,造成这种结

对已知铜矿床(点)的边际效应,响应曲线起伏越 大,表示成矿有利度对预测变量越敏感(图10)。从 图10可以看出,总体上铜成矿有利度与Cu、Ni、Au、

果的原因可能是基尼不纯度重要性度量不仅考虑了 特征变量与已知矿床间的关系,还涉及到特征变量

Mo、Co元素含量呈正相关关系,即已知铜矿床(点) 主要分布在水系沉积物Cu、Ni、Au、M。和Co含量高间相关性的影响。偏依赖图可视化了不同预测变量

Cu- ooooooooCu- o基性岩体临近度-

Ni-

基性岩体临近度-

Ni-

oooPC2- Au-

PC2-

航磁-

Co-

oooo航磁-

Mo- Co-

Mo- Au-

河口群地层-o河口群地层-o2 4 6 8 10 12 0 1 2 3 4平均准确率降低 平均基尼系数降低图9随机森林模型预测要素的重要性排序Fig. 9 Importance order of predictive variables derived from RF modeling420-0.5 0 0.5 1.0 1.50 100 200 300 400 500航磁0 1

Mo河口群地层Fig. 10 Marginal effect of predictors on Cu occurrence based on RF modeling246第2期张士红等:基于随机森林的四川省会理地区“拉拉式”铜矿成矿预测值区。铜成矿有利度与基性岩体临近度呈负相关关

系,即随着与基性岩体的距离变远,已知铜矿床出现 的概率变低,且已知铜矿床(点)基本分布在距离基

性岩体3 km范围内,约1 km范围内相关性最大。 铜成矿有利度与水系沉积物地球化学元素主成分

分析的第二主分量(PC2)呈负相关关系,即已知铜

矿床主要分布于第二因子得分的低值区,主要是

因为第二主分量上Cu元素呈负高因子载荷。此 外,河口群地层的重要性排序靠后,可能的原因是

相较于其它数字特征,河口群地层是二值变量,且

其分布范围受覆盖层的影响较大。但从拉拉铜矿

成矿地质特征和成矿作用机理来看,河口群地层

是已知矿床存在的重要标志。3.2随机森林模型性能评价采用随机森林的袋外误差和ROC曲线评价随

机森林模型的精度。随机森林模型的一个重要优

点,是在建模过程中可以利用袋外数据对误差建立

一个无偏估计(Breiman,2001)。表2为随机森林模 型的性能参数,从表2中可以看出,16个矿化单元

和非矿单元中均有1个发生错误分类,模型的平均

袋外误差为6. 25%。表明基于小训练样本集(16个 已知矿床点)的随机森林模型可产生较好的分类 精度。表2随机森林模型性能参数Table 2 Performance parameters of RF modeling矿化单元无矿单元误分类率矿化单元1516. 25%无矿单元1156. 25%00B error6. 25%全局精度93. 75%AUC0. 938自Spackman将受试者工作特征曲线(ROC)分

析技术引用到机器学习领域,ROC曲线在模型评价 和分类器性能比较等方面得到了广泛的应用。ROC

以假正类率(1 -特异性)为横轴,以真正类率(敏感

性)为纵轴,分别表示实际负类中被预测成正类的 比例和实际正类中被预测为正类的比例。曲线可直

观反映不同阈值下敏感性与特异性的关系,ROC曲

线越靠近左上角(0,1),模型的准确率就越高。此 外ROC曲线可以用来进行证据要素的筛选和二分

类最佳阈值的确定(Chen,2015),常用的最优阈值

的确定方法包括找到离(0,1 )最近的点、尤登指数

和最小损耗。ROC曲线下面积(AUC)是另一重要 评价指标,其值是一个介于0. 0到1. 0之间概率值, 结合ROC曲线的形态可以直观定量的评价预测模

型的好坏。AUC二0.5代表分类器类似于随机猜 测,没有预测价值,AUC二1则代表一个完美分类器

(Lee and Dan,2005 ) o应用ROC曲线评估随机森 林预测模型(图11),AUC值为0. 938,根据尤登指 数确定的有矿和无矿分类的最优阈值为0. 95 ,结果 表明随机森林模型能够很好的拟合现有数据集,对

铜成矿具有重要的指示意义。图11随机森林模型的ROC曲线Fig. 11 ROC curves of RF modeling3.3研究区成矿远景分析在随机森林模型生成的成矿潜力图基础上,统

计分析已知矿床铜矿床(点)与圈定的成矿远景区 面积关系,绘制矿床累积频率图(图12),开展全区 铜成矿远景分析。具体的做法是首先将成矿潜力图

按照5%的间隔等分为20份,获取一系列成矿有利

度分位数值。以最高的成矿有利度值(100%)作为 边界圈定的成矿远景区在研究区内所占的面积比最

小(«0),而以最低的成矿概率值(0% )作为边界圈

定的成矿远景区占研究区的面积比最大(=1)。然

后以不同的分位数值作为阈值,计算大于该阈值范

围内已知矿床(点)出现的累积频率。从图12中看 出,研究区内成矿有利度高值区5%面积内(成矿有 利度值M0. 98)已知矿床出现的比例为0. 56(9个

矿点),10%面积内(成矿有利度值M0. 95)已知矿 床出现的概率为0. 88(14个矿点),20%面积内(成

矿有利度值M0. 82)已知矿床出现的概率为0. 88

(15个矿点)。而当成矿远景区面积占研究区面积 比达30% (成矿有利度值^0. 66)时,覆盖了全部16 个矿点。247地质与勘探2020 年1.0-(0.88,04)^-^0.94,0.25)(0.94,0.2)孤

呱邑0.8- / (0.88,0.15)報去M呱

fe報0.6(0.56,0.05)gM凶fe0.4*录

同IL) 0.20(0,0)0 0.2

0.4

0.6

0.8 1.0远景区面积占研究区面积比例图12矿床(点)累积频率VS远景区面积比例Fig. 12 Number proportion of mineral deposits versus area

proportion of prospective areas由低到高分别以成矿有利度值0. 82,0. 95,

0.98为阈值对成矿潜力图进行分级。其中红色代 表高成矿有利度单元,橙色代表中成矿有利度单元, 蓝色代表低成矿有利度单元。成矿潜力图显示,已

知的铜矿床(点)除个别(红格拉)矿点外,均处于成 矿潜力异常范围内。根据成矿有利度的强度、面积,

成矿预测要素的分布,以及与已知铜矿床(点)的空 间关系,圈定了 1个I级找矿远景区,2个n级找矿 远景区和2个皿级找矿远景区(图13)。最主要的成矿有利度区带分布于红铜山-嵩枝

坝-落凶-红泥坡-黎洪-姜驿一带,总体呈北北 东-南南西向展布,该区带范围主体对应于河口群

地层、(超)基性岩体,及部分东川群、会理群地层出 露区。河口群地层、(超)基性岩体等地质要素在成

矿预测中是重要因子,同时,这些地质要素的存在也 极大地制约着Cu、Au、Ni、Mo等地球化学元素异常

的分布。因此,该异常的总体格局符合该地区地 质-地球化学要素的空间分布特征。在该成矿有利区带中,蒿枝坝-落函-红泥

坡-姑鲁迷异常片区为I级找矿远景区,其异常强 度和面积大,总体分布呈现出半环形;在该远景区

中,赋矿的河口群地层广泛分布且厚度大,与成矿相

关的辉长岩体多处出露,且已经探明了落凶、红泥坡 大型铜矿床,老羊汗滩中型铜矿床,并有双狮、板山

头、石龙等铜矿点分布于其中,指示该区具有很好的 成矿条件,并仍有大的找矿潜力。勘探资料显示,该 异常片区内从落曲向东南到老羊汗滩、石龙,赋矿的 河口群落曲组地层中火山岩的厚度变薄至缺失③,

这表明火山活动中心在西边;异常的西部受到一组 北北东走向的大断裂(F2、F13)限制,该断裂组具有 地表逆冲、深部正断和明显的走滑特点④,构成落凶

248组与通安组(中元古界昆阳群)的接触界线,断裂组 形成和多期次活动于落函组与成矿之后。因此,断

裂西部可能存在另一半环异常,但其错失部分可能

已经下落甚或移出了本研究区,需要在研究判明该 断裂带运动学特征之后再进一步予以分析。打厂坡-吊井洞-木格拉和红铜山东异常区划

为II级找矿远景区。前者成矿有利度异常强度和

面积较大,地表有河口群地层和辉长岩体出露,目 前区内已发现多处小型铜矿床(点),是寻找拉拉 式铜矿的有利地段。后者找矿信息有利度高,虽 然地表由第四系覆盖,但该区内分布有地球化学

元素高异常和航磁高异常,是寻找拉拉式铜矿的 有利地段。银厂簣南和平地镇北局部异常区划为皿级成矿 远景区。前者呈北东走向,与出露的河口群地层展 布方向基本一致,区内有一些(超)基性岩出露,根

据航磁化极上延数据分析,该异常片区内河口群地 层较薄,可能不具有大的找矿潜力。后者走向北

西-南东,主要分布于震旦系、寒武系和奥陶系地层 覆盖区,根据航磁化极数据分析,覆盖层之下未必存

在河口群地层,异常可能由蚀源区带来的重砂矿物 引起。4结论本文应用随机森林方法开展四川会理地区拉拉

式矿床的铜矿预测工作,并基于成矿潜力图进行了 拉拉地区成矿远景分析。随机森林建模一方面可以

评估预测变量的重要性,识别对拉拉式铜矿的找矿

勘探具有重要意义的影响因子;另一方面还利用偏

依赖图(PDP)可以对预测变量和已知铜矿床(点) 的响应关系进行解释。随机森林的袋外误差率和

ROC曲线分析均表明基于小训练样本集(16个已知 矿床点)的随机森林模型可产生较好的分类预测精 度,能够很好地拟合现有数据集,预测结果对拉拉地

区铜成矿预测具有重要的指示意义。随机森林预测结果显示,对四川省会理地区拉

拉式铜矿勘查具有重要意义的4个预测要素是Cu 元素含量,中-晚元古代(超)基性岩体临近度,Ni 元素含量和PC2因子得分。根据成矿远景分析,认 为该研究区覆盖层之下仍具有较大的成矿潜力,高

成矿有利度区带主体上与研究区内主要预测要素异

常空间分布一致,呈北北东向展布;而其次级高成矿 有利度区则呈近东西走向,与成矿地质构造要素

(地层、褶皱)产状协调一致,这些地带已探明或发现第2期张士红等:基于随机森林的四川省会理地区“拉拉式”铜矿成矿预测NCZO9Z

101°50'EN-0L9Z1 -高成矿有利单元;2 -中成矿有利单元;3 -低成矿有利单元;4 -已知矿体投影范围;5 -铜矿床(点);6 - I级找矿远景区;7 - II级找矿远

1 - un让 w让h high mineralization potential;2 - unit with medium mineralization potential;3 - un让 with low mineralization potential;4 - scope projection of

known orebody ;5 - copper deposits( occurrence) ;6 - I - class prospective area;7 - U - class prospective area;8 - HI - class prospective areaN-0L9e0

4 km______ ______ ______ ______ ______ ______ ______ 102°00'E1 | ^2 03 三 4 \"5 刁 6 O?刁 8图13研究区“拉拉式”铜矿找矿远景区Fig. 13 Mineral prospective map of Lala - type deposits in Huili district景区;8-m级找矿找矿远景区249

地质与勘探2020 年的铜矿床(点)在空间上呈近东西向分布,为矿区外 围和深部的勘查工作提供了重要的参考信息。致谢:感谢四川省地质矿产勘查开发局四O三 地质队龚灵明高级工程师在野外地质调查期间给予 的支持,感谢中国地质调查局发展中心程志中研究

员、陈辉工程师在数据收集过程中提供的帮助。[注释]①

四川省地质矿产勘査开发局四o三地质队.2018.平地幅1 :

50000建造构造图[R].② 四川省地质矿产勘査开发局四O三地质队.2018.姜驿幅1 :

50000建造构造图[R].③ 四川省地质局攀西地质大队.1982.会理县拉拉铜矿落凶矿区详

细勘探地质报告[R].④

四川省地质矿产勘查开发局四O三地质队.2016.四丿11省会理县

红泥坡矿区外围铜矿普査报告[R] •[References ]Aitchison J. 1986. The statistical analysis of compositional data[ M] . Lon­

don ,New York: Chapman and Hall:416.Agterberg F P. 1992. Combining indicator patterns in weights of evidence

modeling for resource evaluation [ J] . Natural Resources Research,

1(1):39 -50.Bonham - Carter G F. 1994. Geographic information systems for geoscien­

tists :Modelling with GIS[ M]. Pei^amon:Ontario:398.Breiman L. 1996. Bagging predictors[ J]. Machine Learning,24(2) : 123 -

140.Breiman L. 2001. Random forests[ J]. Machine Learning ,45 :5 -32.Breslow N E,Cain K C. 1988. Logistic regression for two - stage case -

control data[ J] . Biometrika,75 (1) :11 -20.Carranza E J M,Laborte A G. 2015. Random forest predictive modeling of

mineral prospectivity with small number of prospects and data with missing values in Abra ( Philippines ) [ J ] . Computers & Geosci­

ences, 74: 60 -70.Carranza E J M. 2011. Geocomputation of mineral exploration targets[ J].

Computers & Geosciences,37( 12) :1907 - 1916.Chen Bomao. 1981. Discussion on the reasonable density of exploration

grid of Lala deposit [J]. Geology and Exploration, (9 ) : 43 - 47 (in

Chinese with English abstract).Chen W T,Zhou M F,Zhao X F.2013. Late Paleoproterozoic sedimentary

and mafic rocks in the Hekou area,SW China:Implication for the re­

construction of the Yangtze Block in Columbia [J] . Precambrian Re­search,231 :61 -77.Chen W T,Zhou M F. 2012. Paragenesis,stable isotopes,and molybdenite

Re - Os isotope age of the Lala iron - copper deposit, Southwest Chi- na[ J] . Economic Geology ,107 :459 -480.Chen Y L,Wu W.2017. Mapping mineral prospectivity using an extreme

learning machine regression [ J]. Ore Geology Reviews, 80:200 - 213.Chen Y L. 2015. Mineral potential mapping with a restricted Boltzmann

machine[ J]. Ore Geology Reviews,71 :749 - 760.Cheng Q M. 2015. BoostWofE: A new sequential weights of evidence mod­

el reducing the effect of conditional dependency [ J]. Mathematical250Geosciences,47(5) :591 -621.Chung C F. 1978. Computer program for the logistic model to estimate the

probability of occurrence of discrete events [J] . Geological Survey of Canada,Paper 78 - 12 :23.Cracknell M J, Reading A M. 2014. Geological mapping using remote

sensing data: A comparison of five machine learning algorithms, their

response to variations in the spatial distribution of training data and

the use of explicit spatial information [ J ]. Computers & Geosci­

ences, 63(1) ;22 -33.Egozcue J J,Pawlowsky - Glahn V, Mateu - Figueras G, Barceld - Vidal

C. 2003. Isometric logratio transformations for compositional data a-

nalysis[ J]. Mathematical Geology,35(3) :279 - 300.Filzmoser P,Hron K,Reimann C,Garrett R. 2009. Robust factor analysis

for compositional data[ J]. Computers & Geosciences,35(9) :1854 - 1861.Greentree M R, Li Z X. 2008. The oldest known rocks in south - western

China: SHRIMP U - Pb magmatic crystallization age and detrital provenance analysis of the Paleoproterozoic Dahongshan Group[ J]. Journal of Asian Earth Sciences,33(5 -6) :289 -302.Harris D P.Zurcher L,Stanley M,Marlow J,Pan G C. 2003. A compara­

tive analysis of favourability mappings by weights of evidence, prob- abilistic neural networks, discriminant analysis, and logistic regres­sion [ J] .Natural Resources Research, 12:241 -255.Harris D V,Pan G C. 1999. Mineral favorability mapping:A comparison of

artificial neural networks, logistic regression, and discriminant analy- sis[ J]. Natural Resources Research,8(2) :93 -109.He Defeng, Zhong Hong, Zhu Weiguang, Xiao Fang. 2010. Geochemical

characteristics of the ore - bearing strata metasedimentary host rocks

in the Lala copper deposit, Sichuan Province [ J ]. Earth Science

Frontiers, 17(4) :218 -226(in Chinese with English abstract).He Shan,Li Zhijun,Dong Fuquan,You Meng,Chen Shumin.2018. Multi­

ple information metallogenic prediction based on the analytic hierar­

chy process: A case study of the Lhozhag area in Tibet [ J ]. Geology and Exploration, 54 ( 1 ) : 148 - 157 ( in Chinese with English ab­

stract) .Lee S,Dan N T. 2005. Probabilistic landslide susceptibility mapping in

the Lai Chau Province of Vietnam: Focus on the relationship between tectonic fractures and landslides [ J ]. Environmental Geology,

48(6):778 -787.Li Xinhai. 2013. Using*4random forestHfor classification and regression] J].

Chinese Journal of Applied Entomology, 50 (4) : 1190 - 1197 ( in Chinese with English abstract).Li Xinhai. 2019. Random forest is a specific algorithm,not omnipotent for

all datasets[ J]. Chinese Journal of Applied Entomology, 56 ( 1 ):

172 - 181 (in Chinese with English abstract).Liaw A, Winener M. 2002. Classification and regression by randomfbr-

est[ J]. R News,2(3) :18 -22.Liaw A. 2012. Package “ randomForest\". http: // stat - www. berkele.

edu. /users/breimfin/Randoin Forests.Liu Yanpeng, Zhu Lixin, Zhou Yongzhang. 2018. Application of Convolu­

tional Neural Network in prospecting prediction of ore deposits: Taking

the Zhaqjikou Pb - Zn ore deposit in Anhui Province as a case [J].

第2期张士红等:基于随机森林的四川省会理地区“拉拉式”铜矿成矿预测Acta Petrologica Sinica,34(11) :3217 -3224(in Chinese with Eng­lish abstract).Luo Liping, Chen Liang,Zhao Huaijun. 2015. Two types of copper deposit

hosted by the Hekou Group of Lala district in Sichuan Province[ J]. Acta Mineralogica Sinica,35(Sl) :912(in Chinese with English ab­stract) .Mao Xiancheng, Zou Pinjuan, Cao Fang, Hu Chao, Zhang Baoyi, Zhou

Shangguo. 2013. GIS - based extended weights of evidence method based on linear regression in metallogenic prognosis[ J]. Science of

Surveying and Mapping, 38 ( 3 ) : 18 - 21 ( in Chinese with English abstract).McCuaig T C,Beresford S, Hronsky J. 2010. Translating the mineral sys­tems approach into an effective exploration targeting system[ J]. Ore Geology Reviews,38(3) :128 -138.Mckay G,Harris J R. 2016. Comparison of the data - driven random for­

ests model and a knowledge - driven method for mineral prospectivity mapping: A case study for gold deposits around the Huritz Group and

Nueltin Suite, Nunavut, Canada [ J] . Natural Resources Research, 25(2):125 -143.Min Z, Zhang D X, Zhang ZT,LiT X,Li C W,Wei C C. 2018. Structural controls on the Lala Iron - copper deposit of the Kangdian metallo­genic province, southwestern China: Tectonic and metallogenic impli-

cations[ J]. Ore Geology Reviews,97:35 -54.Porwal A, Carranza E J M. 2015. Introduction to the special issue: GIS -

based mineral potential modelling and geological data analyses for

mineral exploration[ J]. Ore Geology Reviews ,71 :477 -483.Rahmati 0, Pourghasemi H R, Melesse A M. 2016. Application of GIS -

based data driven random forest and maximum entropy models for

groundwater potential mapping: A case study at Mehran region, Iran[ J] . Catena,137 :360 -372.Ren Tianxiang, Wu Zonghua,Qiang Rongsheng. 1998. Methods and tech­

niques for the regional geochemical anomaly sorting and follow - up

survey [ M ] . Beijing: Geological Publishing House: 138 ( in Chi­

nese ).Rodriguez - Galiano V F, Chica - Olmo M, Chica - Rivas M. 2014. Pre­

dictive modelling of gold potential with the integration of multisource

information based on random forest: A case study on the Rodalquilar area, Southern Spain [J] . International Journal of Geographical Infor­

mation Science,28(7) :1336 -1354.Schill W,Jockel K H,Drescher K,Timm J. 1993. Logistic analysis in case -

control studies under validation sampling [J]. Biometrika, 80 ( 2 ):

339-352.Singer D A, Kouda R. 1997. Classification of mineral deposits into types

using mineralogy with a probabilistic neural network[ J]. Natural Re­sources Research,6( 1) :27 -32.Wang Jiangzhen, Li Zeqin, Huang Congjun. 2012. The main geological e-

vents of the Kangdian Proterozoic Eon and response from to the La - La IOCG deposit[ J]. Advances in Earth Science,27 (10) : 1074 -

1079( in Chinese with English abstract).Xiong Y H,Zuo R G,Carranza E J M. 2018. Mapping mineral prospectivi­

ty through big data analytics and a deep learning algorithm [J]. Ore

Geology Reviews, 102:811 - 817.Xiong Yihui.Zuo Renguang. 2016. Recognition of geochemical anomalies

using a deep autoencoder network [ J]. Computers & Geosciences, 86:75 -82.Xu Shanfa,Chen Jianping, Ye Jihua. 2006. Application of evidence weight

method in the copper - gold mineral resources prediction in the north

section of the Sanjiang region [ J ]. Geology and Exploration ,42 ( 2 ): 54 - 59 (in Chinese with English abstract).Zeng Xingeng, Tian Jingya. 1987. Taking notice of discovering Kuroko

type deposit in the Tianbaoshan Formation of the Huili Group on the

Kang - Dian Axis [J]. Geology and Exploration, (6) : 14 - 21 (in Chinese with English abstract).Zhang Lei, Wang Linlin, Zhang Xudong, Liu Shirong, Sun Pengsen, Wang

Tongli. 2014. The basic principle of random forest and its applica­tions in ecology:a case study of Pinus Yunnanensis[ J] . Acta Eco- logica Sinica,34(3) :650 -659(in Chinese with English abstract).Zhang S,Xiao K Y,Carranza E J M,Yang F. 2018. Maximum entropy and

random forest modeling of mineral potential: Analysis of gold prospec­

tivity in the Hezuo - Meiwu district, west Qinling Orogen, China [J]. Natural Resources Research, https://doi. org/10. 1007/sll053 -

018 -9425 -0.Zhao X F, Zhou M F. 2011. Fe - Cu deposits in the Kangdian region, SW

China: A Proterozoic I0CG(iron - oxide - copper - gold) metallogen­ic province[ J]. Mineralium Deposita,46(刀:731 -747.Zhou Jiayun, Chen Jiabiao, Shen Bing, Zhu Zhimin, Liu Feiyan, Luo Li­

ping, Li Xiaoyu. 2008. Tectono - metallogenic mechanism for the

Lala copper deposit, Sichusui [ J ]. Geotectonica et Metallogenia,

32(1) :98 - 104(in Chinese with English abstract).Zuo R G, Carranza E J M. 2011. Support vector machine: A tool for map­

ping mineral prospectivity[ J]. Computers & Geosciences,37 ( 12): 1967 -1975.[附中文参考文献]曾忻耕,田竞亚1987.注意在康滇构造带会理群天宝山组地层中发

现“黑矿型”矿床[J] •地质与勘探,(6):14-21.陈伯茂.1981.拉拉厂铜矿勘探网密度合理性的探讨[J].地质与勘

探,(9):43 - 47.何德锋,钟宏,朱维光,肖芳.2010•四川拉拉铜矿床赋矿层位变质沉

积岩地球化学特征[J] •地学前缘,17(4) :218 -226.何珊,李志军,董富权,尤孟,陈満民.2018.基于层次分析法的多元信

息成矿预测研究一以西藏洛扎地区为例[J].地质与勘探,

54(1):148 -157李欣海.2013.随机森林模型在分类与回归分析中的应用[J] •应用

昆虫学报,50(4):1190-1197.李欣海2019.随机森林是特点鲜明的模型,不是万能的模型[J ] •应

用昆虫学报,56(1):172-181.刘艳鹏,朱立新,周永章.2018.巻积神经网络及其在矿床找矿预测中

的应用-以安徽省兆吉口铅锌矿床为例[J]・岩石学报,

34(11):3217 -3224.罗丽萍,陈良,赵怀军.2015.四川拉拉地区河口群中赋存的两类铜矿

床[J] •矿物学报,35(S1):912.毛先成,邹品娟,曹芳,胡超,张宝一,周尚国-2013.GIS支持下的线

性回归证据权法扩展及成矿预测[J].测绘科学,38(3):

18 -21.251地质与勘探任天祥,伍宗华,羌荣生• 199&区域化探的异常筛选与查证的方法技

2020 年张雷,王琳琳,张旭东,刘世荣,孙鹏森,王同立.2014.随机森林算法

基本思想及其在生态学中的应用一以云南松分布模拟为 例[J] ■生态学报,34(3) :650 -659.术[M].北京:地质出版社:138.王奖臻,李泽琴,黄从俊.2012.康滇地轴元古代重大地质事件与拉拉

IOCG矿床成矿响应[J]-瞬科学进展,27(10) : 1074 -1079.周家云,陈家彪,沈冰,朱志敏,刘飞燕,罗丽萍,李潇雨• 2008 •四川拉

拉铜矿构造成矿动力学机制[J]•大地构造与成矿学,32(1):

98 -104.徐善法,陈建平,叶继华.2006.证据权法在三江北段铜金矿床成矿预

测中的应用研究[J]・地质与勘探,42(2) :54 -59.Random Forest -Based Mineralization Prediction of the Lala - Type Cu Deposit in the Huili Area,

Sichuan ProvinceZHANG Shihong1,2 ,XIAO Keyan1(1. MNR Key Laboratory of Metallogeny and Mineral Assessment, Institute of Mineral Resources, Chinese Academy of

Geological Sciences 9 Beijing 100037 ;2. China University of Geosciences ( Beijing) , Beijing 100083)Abstract:The Huili - Huidong district of Sichuan Province,China is well known for its rich copper resources. In recent years,many lai^e and medium -

sized copper deposits have been explored, indicating that the district still has a good prospecting potential. Based on geologic, geophysical and geochemical data available, using the random forest ( RF) method, this work made prediction of mineralization of the Lala - type copper deposits in this area. Sixteen cop­per deposits( occurrences) and nine digital maps were used as independent variables associated with the Cu deposits in RF modeling. Global accuracy of

Out of Bag, 00B, derived from the RF modeling is 93. 75 %. The ACU value under the ROC ( Receiver Operating Characteristic) curve is 0. 93& The RF modeling was used to rank the importance of predictive variables. The response relationship between predictive variables and known Cu deposits is illustra­

ted and explained by a partial dependence plot( PDP) . The logarithms of Cu, Ni content in stream sediments, distance to mafic intrusion, second principal component scores, PC2, of geochemical data based on isometric log - ratio transformed were the top 4 predictive variables selected according to the impor­

tance inferred with respect to the presence of Lala - type Cu deposits. Mineral potential maps were prepared by the RF model and were reclassified into

three likelihood levels or zones according to a(< accumulative frequency of deposits** function criterion, and six mineral prospects were delineated. The main NNE trending anomalous zone with high likelihood of discovery values in the predictive map appears consistent with the spatial distribution of important

predictive variables, and the minor approximate EW - trending high anomalous level zones that are consistent with the occurrence of ore - forming geolog­ical structures. The superimposed zones of the NE - trending and EW - trending anomalies happen to be the main locations of known copper deposit sites.

Their extensions to the east and west are covered by strata older than the Hekou Group and are considered as favorable copper prospects for further explora­tion. The results have also indicated that the combination of RF modeling is an effective tool for mineral potential mapping when only data of a few known

mineral occurrences are available.Key words:Random Forest, mineral prospect mapping, compositional data, Receiver Operating Characteristic (ROC) , Lala - type copper deposit,

Huili area,Sichuan252

因篇幅问题不能全部显示,请点此查看更多更全内容