Stage
Deep learning pour la prévision à court terme des précipitations
Contexte
La prévision immédiate (ou à court terme, de 30 min à 2 heures) des précipitations (rain nowcasting) est cruciale dans de multiples secteurs de nos sociétés. Cela est particulièrement vrai dans les domaines de la circulation autoroutière, les systèmes d’alerte précoce contre les inondations subites (flash flood), mais aussi les services d’urgence, la gestion de l’énergie, le contrôle du trafic aérien, etc. Les précipitations très fortes sont à même de provoquer les dégâts les plus importants d’un point de vue socio-économique.
Les systèmes de prévisions immédiates se doivent donc de fournir des informations pertinentes avec des marges d’erreur acceptables même en présence d’épisodes extrêmes. Ces situations, par définition rares, sont difficiles à modéliser et à prévoir. Elles nécessitent donc des outils de prévision performants.
Description
Les approches pour traiter la prévision immédiate des précipitations sont abondantes et variées [Prudden et al. 2020]. Elles se basent majoritairement sur des observations radars qui permettent d’identifier et d’assurer le suivi des structures de pluie. Actuellement, les services météorologiques et hydrologiques effectuent cette tâche à l’aide d’algorithmes « traditionnels », issus de la communauté de la prévision immédiate des précipitations.
Bien qu’adaptés pour l’observation des cellules pluvieuses, les radars météorologiques fournissent des images qui restent parfois difficiles à interpréter. La présence d’échos fixes, d’anomalies de propagation, d’oiseaux, d’insectes, etc peuvent rendre l’identification et le suivi des structures de pluie difficiles. C’est dans ce contexte que les méthodes d’apprentissage statistique peuvent être mises à profit. Les progrès colossaux en traitement d’images, issus de l’intelligence artificielle, sont couramment utilisés pour l’identification d’objets, la détection d’anomalie, l’« inpainting », etc.
Ces méthodes ont également fait leur apparition dans le domaine de la météorologie. Elles permettent de développer de nouveaux modèles, basés sur l’apprentissage de volume important de données disponibles [Shi et al., 2017][Ma et al., 2022][Che et al., 2022]. Récemment, une approche du type Réseaux Antagonistes Génératifs (Generative Adversarial Network) [Ravuri et al., 2021] à outrepasser les performances de modèles plus classique [Pulkkinen et al., 2019] [Agrawal et al., 2019], pour des prévisions allant au-delà de l’heure.
L’objectif du stage sera de développer un modèle de suivi et d’évolution des cellules pluvieuses à partir d’observations radars. Plusieurs approches seront envisagées comme par exemple une approche par réseau de type TrajGRU [Shi et al., 2017] ou à l’aide de réseaux basés sur des mécanismes d’attention [Che et al., 2022] ou l’aide d’une approche par réseaux GAN [Ravuri et al., 2021]. Le candidat commencera par une étude bibliographique qui lui permettra de se familiariser avec les différents approches mises en œuvre pour la prévision immédiate des précipitations.
Le cœur du stage consistera à choisir, adapter et entrainer un modèle en s’appuyant sur l’environnement Pytorch. Il conviendra également de réfléchir aux métriques qui permettront d’évaluer les performances du modèle et permettre des comparaisons avec les modèles standards.
En fonction de temps, le stagiaire pourra travailler sur l’amélioration du modèle grâce à l’ajout d’observations auxiliaires en entrée de celui-ci permettant ainsi de prendre en compte un contexte local (topographie, type d’habitat, saison.).
Compétences requises
Modélisation statistique, programmation python, connaissances sur la physique de l’atmosphère bienvenues.