同自然灾害抗争是人类生存发展的永恒课题。
——————习近平

【齐文文等-NHR】AWS AutoGluon:一种应用于滑坡与其他自然灾害危险性建模的新框架

发布时间: 2021-11-18

来源: 办公室

精度、稳定性、效率是衡量滑坡灾害危险性评价模型质量的重要方面,如何提升这些标准是当前研究的重点与难点。本研究介绍一种可应用于滑坡与其他类型自然灾害危险性建模的一种革命性框架,AWS AutoGluon API,并进行了实际应用示范。在该框架或平台中,研究人员只需极少量的代码:4行代码,即可实现数据预处理、分类问题判定、算法选择与构建、模型训练和参数优化、模型预测应用和评估等步骤。本文通过AutoGluon API框架集成的11机器学习模型,分别是Random Forest (Gini)、Random Forest (Entropy)、Extra Trees (Gini)、Extra Trees (Entropy)、K-Neighbors (Uniform)、K-Neighbors (Distance)、LightGBM、LightGBM (Custom)、Catboost、Neural Network、Weighted ensemble (Level 2),对九寨沟地震触发的4800多处滑坡进行了危险性建模,并利用广为接受的AUC值来评价模型的表现。结果表明所有模型的AUC得分均高于90%,全部模型训练、评估耗时仅47.33秒。权重集成模型表现最佳,AUC得分为94.07%;随机森林模型(Gini参数)是表现最好的单独模型,AUC得分为93.77%。这表明了这一滑坡危险性评价AutoGluon API框架表现出较传统的滑坡危险性评价方法的更高的精度、更好的稳定性与极高的效率。AutoGluon API框架大大提升了滑坡评价的质量,能够帮助研究人员远离大量代码工作,更加专注于专业问题的研究。

表 AutoGluon中不同模型的训练时间、推理时间和精度指标

No.

Models

Training performance

Testing performance (%)

Time (s)

AUC (%)

AUC

Precision

Recall

Accuracy

1

Random Forest (Gini)

1.56

94.71

93.77

87.01

85.21

86.11

2

Random Forest (Entropy)

1.57

94.68

93.68

87.31

85.5

86.85

3

Extra Trees (Gini)

1.2

93.13

92.85

86.31

85.8

86.85

4

Extra Trees (Entropy)

1.38

93.04

92.87

86.61

86.09

86.85

5

KNN (Uniform)

0.02

93.29

91.17

84.68

89.94

86.85

6

KNN (Distance)

0.01

92.76

91.52

84.68

89.94

86.85

7

LightGBM

2.88

94.64

93.13

89.12

88.46

88.03

8

LightGBM (Custom)

3.78

94.9

93.55

88.18

87.28

88.04

9

Catboost

9.13

94.91

93.62

-

-

87.74

10

Neural Network

23.98

94

92.22

87.69

93.2

87.59

11

Weighted ensemble model (Level 2)

1.82

95.42

94.07

89.12

94.97

88.92


图 利用验证数据评估的AutoGluon中不同模型的ROC曲线

该工作受到中央级公益性科研院所基本科研业务专项资助项目(ZDJ2020-01)和国家重点研发计划(2018YFC1504703)的资助。

该研究成果发表在期刊Natural Hazards Research上:

Qi W, Xu C*, Xu X (2021) AutoGluon: A revolutionary framework for landslide hazard analysis. Natural Hazards Research, 1(3): 103-108.