前言
本文基于 Kaggle平台——洪水数据集的回归预测(文末附数据集),引见一种基于CNN-LSTM网络的回归预测模型。
以下是数据集中各列的形容(包含配置称号的含意):
MonsoonIntensity(季风强度):这一特色或者权衡该地域季风降雨的强度和频率,较高的值示意降雨强度更大,或者更频繁,这或者会造成更高的洪水危险。
TopographyDrainage(地形排水):反映地形的自然排水才干。更好的排水才干(或者由更高的分数示意)或者标明,因为人口浓密或主要地域的水流更好,洪水危险更低。
RiverManagement(河流控制):评价河流在防洪方面的控制状况,包含河岸、大坝和其余基础设备的保养。更高的分数或者象征着更好的控制,有或者降落洪水危险。
Deforestation(森林砍伐):权衡影响土壤稳固性和吸水性的森林砍伐率或水平。更高的森林砍伐分数或者标明森林笼罩的损失更大,更容易遭到洪水的影响。
Urbanization(市区化):示意市区开展水平,因为不透水外表的参与,通常会降落土地排汇降雨的自然才干。市区化水平的提高或者与洪水危险的参与无关。
ClimateChange(气象变动): 评价气象变动的影响,如降雨量参与或海平面回升,这或者会加剧洪水。得分越高或者示意更容易遭到这些变动的影响。
DamsQuality(水坝品质): 钻研大坝在防洪中的状况和有效性。大坝品质差或保养不善或者造成更高的洪水危险。
Siltation(淤积): 测量水体中淤泥沉积的水平,这会降落其控制水流的才干,参与洪水危险。
AgriculturalPractices (农业通常): 评价农业优惠对洪水危险的影响,思考灌溉方法和土地经常使用等或者影响径流和土壤腐蚀的起因。
Encroachments(侵扰): 对人类入侵洪水易发地域的水平启动评分,这或者会加剧洪水的重大性。
IneffectiveDisasterPreparedness(有效的劫难预备): 反映了备灾方案及其实施的无余。得分越高或者标明预备上班越差,潜在的破坏和洪水复原期间越长。
DrainageSystems(排水系统): 评价市区和乡村地域排水系统处置强降雨和水流的效率和容量。
CoastalVulnerability(海岸软弱性): 评价沿海地域因风暴潮、海平面回升和气旋优惠等起因而出现洪水的危险。
Landslides(滑坡): 示意山体滑坡的危险和历史,当这些自然大坝决堤时,山体滑坡会梗塞河流,并在下游形成突发洪水。
Watersheds(流域): 评价流域的肥壮和控制,流域在控制水资源和减轻洪水危险方面施展着主要作用。
DeterioratingInfrastructure(始终好转的基础设备): 检查与洪水控制关系的基础设备的总体状况,如上水道、桥梁和路线。好转会阻碍有效的洪水应答。
PopulationScore(人口得分): 测量洪水易发地域的人口密度或增长,这或者会影响洪水对人类社区的影响。
WetlandLoss(湿地散失): 量化湿地的缩小,湿地经过排汇洪水起到自然缓冲作用。
InadequatePlanning(方案无余): 评价区域和市区布局在多大水平上整合了洪水危险控制,包含分区和土地利用政策。
PoliticalFactors(政治起因): 思考政治决策、控制和政策实施如何影响洪水控制通常。
FloodProbability(洪水概率): 该结果变量基于上述起因预测洪水的或者性,或者示意为0到1之间的概率。
1 数据预处置
2 基于CNN-LSTM的回归预测模型
2.1定义CNN-LSTM网络模型
2.2设置参数,训练模型
50个epoch,MSE 极小,CNN-LSTM回归预测模型预测成果清楚,模型能够充沛提取数据特色,收敛速度快,性能优越,预测精度高,适当调整模型参数,还可以进一步提高模型预测体现。
留意调整参数:
3 结果可视化和预测、模型评价
3.1 预测结果可视化
3.2 模型评价