Aller au contenu principal

Soutenance de thèse de Reza Mahmoudi Kouhi

12 juillet 2024 13 h

Lieu : Pavillon de l’Envirotron, salle 1240 et en ligne

Leveraging unlabeled data for semantic segmentation of 3D mobile LiDAR point cloud using a label-efficient learning approach

La segmentation sémantique des vastes nuages de points en cartographie mobile est cruciale pour l'urbanisme, la conception d'infrastructures et la navigation autonome. Cependant, leur nature irrégulière et massive présente des défis majeurs pour une segmentation précise. Cette thèse aborde ces défis en proposant de nouvelles méthodologies concernant la préparation des données, l'apprentissage contrastif auto-supervisé et les approches de pseudo-étiquetage. Les objectifs de recherche de cette thèse sont doubles : (1) concevoir une approche de préparation des données qui puisse alimenter de manière optimale des réseaux neuronaux avec des sous-ensembles de points, tout en préservant les informations spatiales et représentatives des caractéristiques du nuage de points, et (2) concevoir et mettre en œuvre des méthodes d'apprentissage efficaces en termes d'étiquetage qui exploitent les ensembles massifs de données non étiquetées afin de réaliser la segmentation sémantique précise des nuages de points en cartographie mobile à grande échelle.

L'atteinte du premier objectif est adressée dans le chapitre 2 qui présente de nouvelles méthodes de préparation des données adaptées aux nuages de points LiDAR 3D à grande échelle en extérieur. Après avoir mené des expérimentations et évaluations approfondies, incluant des comparaisons avec les méthodes de l'état de l'art, les méthodes proposées démontrent de meilleures performances en termes de précision et robustesse du réseau. Le chapitre 3 se concentre sur la réalisation du deuxième objectif en introduisant CLOUDSPAM, une approche d'apprentissage contrastif spécifiquement adaptée aux ensembles de données de cartographie mobile. En exploitant des techniques d'augmentation des données, un pré-entraînement auto-supervisé et des ensembles de données hétérogènes fusionnés, CLOUDSPAM surmonte les défis liés au manque de paires positives et négatives et aux contraintes de gestion de la mémoire. Les expérimentations réalisées mettent en évidence l'efficacité de CLOUDSPAM pour la segmentation sémantique de divers jeux de données, même lorsque les données étiquetées sont limitées. Bien que CLOUDSPAM soit efficace et comparable à l'état de l'art, il présente certaines limites liées à l'apprentissage contrastif auto-supervisé. Le chapitre 4 présente une solution complète pour aborder ces limitations. Celle-ci exploite des pseudo-étiquettes générées par un réseau pré-entraîné (i.e. Teacher), ainsi que des banques de mémoire par classe et un module de purification de segments. Dans l'ensemble, cette thèse apporte une contribution significative à l'avancement de l'état de l'art en matière de segmentation sémantique des nuages de points en cartographie mobile à grande échelle.

Participation en ligne
Accéder au Zoom

650 8618 5164
424629

Informations supplémentaires :

Membres du jury

Présidente

Mme Marie-Hélène Vandersmissen

Faculté de foresterie, de géographie et de géomatique, Université Laval

Directrice de recherche

Sylvie Daniel

Faculté de foresterie, de géographie et de géomatique, Université Laval

Codirecteur de recherche

Phillipe Giguère

Faculté des sciences et de génie, Université Laval

Examinateur UL

Denis Laurendeau

Faculté des sciences et de génie, Université Laval

Examinateur externe

Gunho Sohn

York University

Examinateur supplémentaire

Éric Guilbert

Faculté de foresterie, de géographie et de géomatique, Université Laval

Retourner à la liste d'événements