研究土壤对重金属的吸附对于了解重金属的归宿和正确评估相关环境风险具有重要意义。然而,现有的用于量化吸附的实验方法和传统模型既费时又无效。在此,浙江大学王飞儿副教授以及美国凯斯西储大学张慧春教授等人开发了用于六种重金属(Cd(II)、Cr(VI)、Cu(II)、Pb(II)、Ni(II) 和 Zn(II))土壤吸附的机器学习(ML)模型,使用了从150篇期刊文章中提取的4420个数据点(1105个土壤)。作者研究6种传统ML模型(分类回归树、线性回归、随机梯度下降回归、支持向量回归、岭回归、K-最近邻)和4种集成模型(极端随机树、随机森林、梯度提升决策树、极端梯度提升)对土壤重金属吸附的预测性能,从土壤、吸附系统和重金属的特性中确定吸附的关键因素并首次预测了六种重金属在全球范围内的相对吸附能力。图1. 输入参数对吸附的影响结果表明,梯度提升决策树( GBDT)模型具有最佳预测性能。所涉及特征重要性排序如下:阳离子交换能力>平衡浓度> pH(土壤)>粘土含量>有机碳含量>离子半径>水合离子半径>土壤-溶液比 > pH(溶液)>第一电离能>离子强度 > 溶液温度。在此基础上为六种金属开发了六个独立模型,以获得比组合模型更好的模型性能。使用这些独立模型,可以根据已知的土壤特性预测土壤上重金属吸附能力的全球分布。当土壤/沉积物的吸附量已知时,还使用相同的数据集建立了反向模型,包括所有六种金属的一个组合模型和六个独立模型,以预测水中的重金属浓度。图2. 六种重金属独立模型的开发Predicting Heavy Metal Adsorption on Soil with Machine Learning and Mapping Global Distribution of Soil Adsorption Capacities, Environmental Science & Technology 2021. DOI: 10.1021/acs.est.1c02479