Robust Learning of a depth map for obstacle avoidance with a monocular stabilized flying camera

Le drone orienté grand public est principalement une caméra volante, stabilisée et de bonne qualité. Ceux-ci ont démocratisé la prise de vue aérienne, mais avec leur succès grandissant, la notion de sécurité est devenue prépondérante.Ce travail s'intéresse à l'évitement d'obstacle, to...

Full description

Bibliographic Details
Main Author: Pinard, Clément
Other Authors: Université Paris-Saclay (ComUE)
Language:en
Published: 2019
Subjects:
Online Access:http://www.theses.fr/2019SACLY003/document
id ndltd-theses.fr-2019SACLY003
record_format oai_dc
spelling ndltd-theses.fr-2019SACLY0032020-02-03T15:25:38Z Robust Learning of a depth map for obstacle avoidance with a monocular stabilized flying camera Apprentissage robuste d'une carte de profondeur pour l'évitement d'obstacle dans le cas des cameras volantes, monoculaires et stabilisées Carte de profondeur Robuste Caméra monoculaire Caméra stabilisée Reseau de neurones Apprentissage profond Depth map Robust Stabilized camera Monocular camera Neural networks Deep learning Le drone orienté grand public est principalement une caméra volante, stabilisée et de bonne qualité. Ceux-ci ont démocratisé la prise de vue aérienne, mais avec leur succès grandissant, la notion de sécurité est devenue prépondérante.Ce travail s'intéresse à l'évitement d'obstacle, tout en conservant un vol fluide pour l'utilisateur.Dans ce contexte technologique, nous utilisons seulement une camera stabilisée, par contrainte de poids et de coût.Pour leur efficacité connue en vision par ordinateur et leur performance avérée dans la résolution de tâches complexes, nous utilisons des réseaux de neurones convolutionnels (CNN). Notre stratégie repose sur un systeme de plusieurs niveaux de complexité dont les premieres étapes sont de mesurer une carte de profondeur depuis la caméra. Cette thèse étudie les capacités d'un CNN à effectuer cette tâche.La carte de profondeur, étant particulièrement liée au flot optique dans le cas d'images stabilisées, nous adaptons un réseau connu pour cette tâche, FlowNet, afin qu'il calcule directement la carte de profondeur à partir de deux images stabilisées. Ce réseau est appelé DepthNet.Cette méthode fonctionne en simulateur avec un entraînement supervisé, mais n'est pas assez robuste pour des vidéos réelles. Nous étudions alors les possibilites d'auto-apprentissage basées sur la reprojection différentiable d'images. Cette technique est particulièrement nouvelle sur les CNNs et nécessite une étude détaillée afin de ne pas dépendre de paramètres heuristiques.Finalement, nous développons un algorithme de fusion de cartes de profondeurs pour utiliser DepthNet sur des vidéos réelles. Plusieurs paires différentes sont données à DepthNet afin d'avoir une grande plage de profondeurs mesurées. Customer unmanned aerial vehicles (UAVs) are mainly flying cameras. They democratized aerial footage, but with thei success came security concerns.This works aims at improving UAVs security with obstacle avoidance, while keeping a smooth flight. In this context, we use only one stabilized camera, because of weight and cost incentives.For their robustness in computer vision and thei capacity to solve complex tasks, we chose to use convolutional neural networks (CNN). Our strategy is based on incrementally learning tasks with increasing complexity which first steps are to construct a depth map from the stabilized camera. This thesis is focused on studying ability of CNNs to train for this task.In the case of stabilized footage, the depth map is closely linked to optical flow. We thus adapt FlowNet, a CNN known for optical flow, to output directly depth from two stabilized frames. This network is called DepthNet.This experiment succeeded with synthetic footage, but is not robust enough to be used directly on real videos. Consequently, we consider self supervised training with real videos, based on differentiably reproject images. This training method for CNNs being rather novel in literature, a thorough study is needed in order not to depend too moch on heuristics.Finally, we developed a depth fusion algorithm to use DepthNet efficiently on real videos. Multiple frame pairs are fed to DepthNet to get a great depth sensing range. Electronic Thesis or Dissertation Text en http://www.theses.fr/2019SACLY003/document Pinard, Clément 2019-06-24 Université Paris-Saclay (ComUE) Manzanera, Antoine
collection NDLTD
language en
sources NDLTD
topic Carte de profondeur
Robuste
Caméra monoculaire
Caméra stabilisée
Reseau de neurones
Apprentissage profond
Depth map
Robust
Stabilized camera
Monocular camera
Neural networks
Deep learning

spellingShingle Carte de profondeur
Robuste
Caméra monoculaire
Caméra stabilisée
Reseau de neurones
Apprentissage profond
Depth map
Robust
Stabilized camera
Monocular camera
Neural networks
Deep learning

Pinard, Clément
Robust Learning of a depth map for obstacle avoidance with a monocular stabilized flying camera
description Le drone orienté grand public est principalement une caméra volante, stabilisée et de bonne qualité. Ceux-ci ont démocratisé la prise de vue aérienne, mais avec leur succès grandissant, la notion de sécurité est devenue prépondérante.Ce travail s'intéresse à l'évitement d'obstacle, tout en conservant un vol fluide pour l'utilisateur.Dans ce contexte technologique, nous utilisons seulement une camera stabilisée, par contrainte de poids et de coût.Pour leur efficacité connue en vision par ordinateur et leur performance avérée dans la résolution de tâches complexes, nous utilisons des réseaux de neurones convolutionnels (CNN). Notre stratégie repose sur un systeme de plusieurs niveaux de complexité dont les premieres étapes sont de mesurer une carte de profondeur depuis la caméra. Cette thèse étudie les capacités d'un CNN à effectuer cette tâche.La carte de profondeur, étant particulièrement liée au flot optique dans le cas d'images stabilisées, nous adaptons un réseau connu pour cette tâche, FlowNet, afin qu'il calcule directement la carte de profondeur à partir de deux images stabilisées. Ce réseau est appelé DepthNet.Cette méthode fonctionne en simulateur avec un entraînement supervisé, mais n'est pas assez robuste pour des vidéos réelles. Nous étudions alors les possibilites d'auto-apprentissage basées sur la reprojection différentiable d'images. Cette technique est particulièrement nouvelle sur les CNNs et nécessite une étude détaillée afin de ne pas dépendre de paramètres heuristiques.Finalement, nous développons un algorithme de fusion de cartes de profondeurs pour utiliser DepthNet sur des vidéos réelles. Plusieurs paires différentes sont données à DepthNet afin d'avoir une grande plage de profondeurs mesurées. === Customer unmanned aerial vehicles (UAVs) are mainly flying cameras. They democratized aerial footage, but with thei success came security concerns.This works aims at improving UAVs security with obstacle avoidance, while keeping a smooth flight. In this context, we use only one stabilized camera, because of weight and cost incentives.For their robustness in computer vision and thei capacity to solve complex tasks, we chose to use convolutional neural networks (CNN). Our strategy is based on incrementally learning tasks with increasing complexity which first steps are to construct a depth map from the stabilized camera. This thesis is focused on studying ability of CNNs to train for this task.In the case of stabilized footage, the depth map is closely linked to optical flow. We thus adapt FlowNet, a CNN known for optical flow, to output directly depth from two stabilized frames. This network is called DepthNet.This experiment succeeded with synthetic footage, but is not robust enough to be used directly on real videos. Consequently, we consider self supervised training with real videos, based on differentiably reproject images. This training method for CNNs being rather novel in literature, a thorough study is needed in order not to depend too moch on heuristics.Finally, we developed a depth fusion algorithm to use DepthNet efficiently on real videos. Multiple frame pairs are fed to DepthNet to get a great depth sensing range.
author2 Université Paris-Saclay (ComUE)
author_facet Université Paris-Saclay (ComUE)
Pinard, Clément
author Pinard, Clément
author_sort Pinard, Clément
title Robust Learning of a depth map for obstacle avoidance with a monocular stabilized flying camera
title_short Robust Learning of a depth map for obstacle avoidance with a monocular stabilized flying camera
title_full Robust Learning of a depth map for obstacle avoidance with a monocular stabilized flying camera
title_fullStr Robust Learning of a depth map for obstacle avoidance with a monocular stabilized flying camera
title_full_unstemmed Robust Learning of a depth map for obstacle avoidance with a monocular stabilized flying camera
title_sort robust learning of a depth map for obstacle avoidance with a monocular stabilized flying camera
publishDate 2019
url http://www.theses.fr/2019SACLY003/document
work_keys_str_mv AT pinardclement robustlearningofadepthmapforobstacleavoidancewithamonocularstabilizedflyingcamera
AT pinardclement apprentissagerobustedunecartedeprofondeurpourlevitementdobstacledanslecasdescamerasvolantesmonoculairesetstabilisees
_version_ 1719311725560332288