site de l'Institut Fresnel

Olivier Eches

Méthodes MCMC pour l'analyse d'images hyperspectrales

Résumé

L'imagerie hyperspectrale est très largement employée en télédétection pour des applications aussi diverses que variées, dans le domaine civil comme dans le domaine militaire. Une image hyperspectrale est le résultat de l'acquisition d'une seule image observée sous plusieurs longueurs d'ondes. Par conséquent, chacun des pixels constituant cette image est représenté par un vecteur de mesures (réflectances) appelé spectre. Une étape majeure dans l'analyse des données hyperspectrales consiste à identifier les composants macroscopiques (signatures) présents dans la région observée et leurs proportions correspondantes (abondances).

Les dernières techniques développées pour ces analyses ne modélisent pas correctement ces images. En effet, habituellement ces techniques supposent que les signatures apparaissent comme étant des pixels purs de l'image. Or, un pixel est rarement constitué d'éléments purs distincts l'un de l'autre. Ainsi, les estimations basées sur ces modèles peuvent tout à fait s'avérer bien loin de la réalité. Le but de cette étude est de proposer de nouveaux modèles plus adaptés aux propriétés intrinsèques des images hyperspectrales. Les paramètres inconnus du modèle sont ainsi déduits dans un cadre Bayésien. L'utilisation de méthodes de Monte Carlo par Chaînes de Markov (MCMC) permet de surmonter les difficultés liées aux calculs complexes de ces méthodes d'estimations.

Analyse d'images hyperspectrales à l'aide du Normal Compositional Model

Le Normal Compositional Model (NCM), proposé par Michael T. Eismann et David W.J. Stein, représente les endmembers sous forme de vecteurs Gaussiens dont les moyennes sont estimés à l'aide d'algorithmes d'extraction d'endmembers, tels que le célèbre N-FINDR ou encore le Pixel Purity Index (PPI). Ce modèle statistique nous permet de contourner les problèmes liés à l'estimation des endmembers quand le nombre de pixels purs dans l'image est insuffisant. Un algorithme Bayésien a été développé en se basant sur le NCM et en utilisant les méthodes MCMC.

Les programmes Matlab associés sont disponibles ici : Download the software.

Python : Lien GitHub Python

C++ : Lien GitHub C++

Algorithme Bayésien semi-supervisé pour le démélange d'images hyperspectrales

Une extension de l'algorithme précédent basé sur le Normal Compositional Model lorsque le nombre de composants purs est inconnu est également proposé. Tout d'abord, les spectres doivent appartenir à une bibliothèque connue. Le nombre d'endmembers R et les spectres correspondants sont ajoutés à la liste des paramètres inconnus, en plus des coefficients d'abondances et la variance des endmembers. De manière similaire à l'approche Bayésienne hiérarchique précédente, on définit des lois a priori appropriées pour ces paramètres (nombre de composants, spectres impliqués dans le mélange et leurs abondances respectives) et les hyperparamètres correspondants. Un algorithme MCMC à saut réversible est ensuite employé pour l'estimation.

Les programmes Matlab associés sont disponibles ici :Download the software.

Démélange et segmentation conjointe des images hyperspectrales

La plupart des algorithmes d'inversion analysent les pixels indépendamment. Etant donné qu'une image de télédétection présente souvent des régions homogènes (lacs, champs, etc), une nouvelle approche a été proposée afin de tenir compte de ces corrélations spatiales dans un modèle Bayésien. L'image est supposée découpée en plusieurs classes qui partagent les mêmes moyennes et covariances des coefficients d'abondances. Puis, des variables cachées, ou labels, sont introduits afin de différencier ces classes. Les dépendances spatiales entre ces labels sont modélisés à l'aide de champs de Markov aléatoire qui sont bien adaptés pour décrire des dépendances entre des pixels voisins d'une image. Les abondances, reparamétrisées afin d'exprimer plus facilement les contraintes dans ce contexte particulier, ont été assignées des lois a priori de moyennes et variances inconnues suivant la classe correspondante. Ensuite, d'autres lois a priori ont été judicieusement choisies pour la variance du bruit (ou variance des endmembers dans le cas du NCM) et pour les hyperparamètres. Comme précédemment, les méthodes MCMC sont employées pour l'estimation des paramètres. A partir des estimations MAP approchés des labels, une carte de classification est obtenue. Ensuite, conditionnellement aux estimations MAP des labels, les vecteurs d'abondances sont estimés.