Apprentissage profond non-supervisé pour l’analyse de séries chronologiques d’observations spatiales : Application aux données GPM

Soutenance de thèse

Vibolroth Sambath

LATMOS

Apprentissage profond non-supervisé pour l'analyse de séries chronologiques d'observations spatiales : Application aux données GPM

Date 27/09/2024 14:00

Diplôme Paris-Saclay

Lieu amphitheater Gérard Mégie in OVSQ

Résumé

Résumé

Le cycle de l’eau joue un rôle essentiel pour toute vie sur Terre. L’observation et la quantiﬁcation de ses divers composants sous la pression du changement climatique sont devenues de plus en plus importantes pour la société et la science.

Les réponses de chaque composante du cycle de l’eau au réchauﬀement climatique diﬀèrent fortement d’une région à l’autre. Par exemple, certaines régions ont connu une augmentation des précipitations, tandis que d’autres ont connu une diminution. Il est donc nécessaire d’observer le cycle de l’eau à l’échelle globale.

La télédétection a accumulé une grande quantité de données d’observation spatiale. Concernant les précipitations, la mission Global Precipitation Measurement (GPM) (2014-présent) oﬀre une constellation de satellites équipés de radiomètres micro-ondes, ce qui permet d’obtenir une vaste base de données de température de brillance (TB). Les TB contiennent des informations implicites sur plusieurs variables géophysiques importantes, notamment l’intensité de la pluie, la vapeur d’eau, la température de surface de la mer (SST), la neige et le contenu en eau liquide et glacé dans les nuages.

Notre présente étude utilise le radiomètre (GMI) du GPM Core Observatory, qui est le satellite de référence pour uniﬁer les satellites de la constellation. En considérant les mesures de TB comme des images non conventionnelles, nous proposons une nouvelle méthode pour observer le cycle de l’eau à partir de ces mesures. La segmentation sémantique non-supervisée est appliquée aux données GMI pour extraire des informations sans l’aide d’une annotation ou de données auxiliaires. L’avantage d’une telle approche est qu’elle peut être appliquée à n’importe quel radiomètre de la constellation. Elle est également exempte des incertitudes liées aux données auxiliaires. Des modèles de segmentation non-supervisés de diﬀérentes complexité sont explorés. Nous avons testé des approches qui s’appuient sur des réseaux entièrement convolutifs (FCN) pour extraire des cartes de caractéristiques à partir de l’entrée.

Dans cette optique, nous avons utilisé dans un premier temps un modèle FCN relativement simple composé de quelques couches de convolution 2D. Dans un second temps, afin d’augmenter la complexité du module d’extraction de caractéristiques, nous l’avons remplacé par un réseau de type U-Net. Un modèle FCN basé sur une architecture de type auto encodeur avec un mécanisme d’attention a également été développé. Enfin, une approche par pixel de type k-moyenne a été testée. Pour comparer les performances de ces différents modèles, nous proposons une évaluation externe où les variables géophysiques pertinentes sont utilisées pour le calcul des métriques de segmentation. D’abord, les classes sont attribuées aux variables géophysiques. Ensuite, en convertissant ces variables quantitatives (précipitation et SST) en catégories, elles peuvent être comparées à la segmentation à l’aide de déférentes métriques. Dans l’apprentissage non-supervisé, il est essentiel que chaque classe obtenue représente une variable géophysique ainsi que ses caractéristiques. Les classes de pluie identiﬁées montrent la variabilité intra-annuelles des précipitations régionales. La segmentation préserve également les structures de précipitations telles que les cyclones. À plus grande échelle, les classes de pluie montrent les zones de convergence intertropicale (ITCZ), tandis que les classes sur les océans peuvent représenter la saisonnalité de la SST. Ces résultats montrent que la segmentation non-supervisée est un outil potentiel pour extraire des informations sur le cycle de l’eau à partir des bases de données d’observation spatiales. Ainsi, l’évolution des classes de segmentation, sur des données multi-décennales, pourrait contenir des informations importantes sur les modifications du cycle de l’eau.

Abstract

The water cycle has a significant role in all life on Earth. Observing and quantifying its various components under the effects of climate change has become increasingly important to society and to advancing scientific knowledge. Responses of each component of the water cycle to the warming climate differ highly from one region to another. For instance, some regions have seen an increase in precipitation, while some have experienced a decrease. Consequently, there is an urgent need for global observation of the water cycle. Remote sensing has amassed an unprecedented amount of global observation data. Regarding precipitation, the Global Precipitation Measurement (GPM) mission (2014-present) offers a constellation of satellites with microwave radiometers operating at a similar range of frequency, resulting in a large microwave brightness temperature (TB) dataset from different instruments. The TB contains implicit information on several important geophysical variables, including rain intensity, atmospheric water vapor, sea surface temperature (SST), snowfall, and cloud liquid water.

This study experiments on the TB measurement from the GPM Microwave Imager (GMI) of the Core Observatory, which is the reference satellite for unifying the observations of the constellation. We propose a novel method for observing the water cycle from TB measurements by considering them as unconventional images. Unsupervised semantic segmentation is applied to GMI data to extract information without the help of any labeling or ancillary data. Consequently, an unsupervised approach can be applied to any microwave radiometers. It is also excluded from the uncertainties involved in obtaining the ancillary data. Unsupervised segmentation models of different levels of complexity are explored in this study.

The non-pixel-wise approaches rely on fully convolutional networks (FCN) to extract feature maps from the input. The simplest FCN-based model consists of several convolutional layers as its feature extractor. To increase the complexity, we deepen the network by using U-Net as a feature extractor. The final FCN model comprises an encoder-decoder network with an attention mechanism. Lastly, the pixel-wise approach K-means is tested. To compare the performance of the models, this study proposes an external evaluation where relevant geophysical variables are used for the calculation of segmentation metrics. First, the classes are attributed to geophysical variables.

Only classes representing precipitation and SST are used for further analysis. By converting these quantitative measurements to categorical data, they can be compared to the segmentation using traditional metrics, such as accuracy, precision, recall, and F1-score. One of the main challenges in the unsupervised approach is the validation of the resulting segmentation. Without any supervision, it is crucial that each class obtained from the segmentation represents geophysical variables and exhibits their characteristics. Identified rain classes are shown to be able to follow intra-annual regional precipitation patterns. The segmentation also preserves precipitation structures such as cyclones. On a larger scale, the rain classes show the Inter-tropical Convergence Zones (ITCZ), while the ocean classes can represent the seasonality of SST. The result of this study shows that unsupervised image segmentation is a potential tool for extracting information about the water cycle from a large dataset of remote sensing observations. On a multi-decadal TB dataset, the evolution of segmentation classes might hold important information about the changes in the water cycle.

Informations supplémentaires

Lieu
OVSQ
Amphithéâtre Gérard Mégie
11, boulevard d’Alembert
78280 Guyancourt

Visio
https://uvsq-fr.zoom.us/j/96175093585?pwd=Ltq2vL4ULibyR4Ix9fgUuLPD5fIgtq.1

Composition du jury

Mme Claire MONTELEONI • Department of Computer Science, University of Colorado Boulder / INRIA PARIS
M. Christopher KIDD • NASA / GSFC – University of Maryland College Park
Mme Valérie CIARLETTI • LATMOS – UVSQ / UPS
M. Philippe CHAMBON • CNRM/GMAP – Université Toulouse III Paul Sabatier
Mme Shruti UPADHYAYA • Indian Institute of Technology Hyderabad

Thèse réalisée sous la direction de Cécile Mallet, Nicolas Viltard, Laurent Barthès et Audrey Martini.

Cookie	Durée	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Soutenance

Le climat dans tous ses états !

Soutenance de thèse

Vibolroth Sambath

LATMOS

Résumé

Informations supplémentaires

Composition du jury

Au fil de la page

Actualités

École Polytechnique

Sorbonne Université

UVSQ

Accessibilité

Choisir la langue

Recherche

Partager/Share

Soutenance de thèse

Vibolroth Sambath

LATMOS

Résumé

Informations supplémentaires

Composition du jury

Au fil de la page

Actualités

École Polytechnique

Sorbonne Université

UVSQ

Suivre l'IPSL / Follow us