Vers des modèles synergiques de l’estimation du mouvement en vision biologique et artificielle

Dans cette thèse, nous avons étudié le problème de l'estimation de mouvement chez les mammifères et nous proposons que passer à l’échelle des modèles ancrés dans la biologie pour les applications du monde réel peut nous donner de nouvelles perspectives en vision biologique. En utilisant un modè...

Full description

Bibliographic Details
Main Author: Medathati, Naga Venkata Kartheek
Other Authors: Côte d'Azur
Language:en
Published: 2016
Subjects:
Online Access:http://www.theses.fr/2016AZUR4127/document
id ndltd-theses.fr-2016AZUR4127
record_format oai_dc
spelling ndltd-theses.fr-2016AZUR41272019-12-20T03:25:31Z Vers des modèles synergiques de l’estimation du mouvement en vision biologique et artificielle Towards synergistic models of motion information processing in biological and artificial vision Flux optique Perception du mouvement Dynamique MT Théorie de la bifurcation Vision par ordinateur biologiquement inspirée Optical flow Motion perception MT dynamics Bifurcation theory Neural fields Biologically inspired computer vision Dans cette thèse, nous avons étudié le problème de l'estimation de mouvement chez les mammifères et nous proposons que passer à l’échelle des modèles ancrés dans la biologie pour les applications du monde réel peut nous donner de nouvelles perspectives en vision biologique. En utilisant un modèle classique qui décrit l'activité des neurones dans les aires corticales V1 et MT du cerveau des primates, nous avons proposé une architecture montante pour l'estimation de mouvement et l’avons évaluée sur des exemples de référence de vision par ordinateur (une première pour ce type de modèles), révélant des lacunes telles que le manque de sélectivité au niveau des frontières de mouvement et l'absence d'association spatiale du champ de vitesses. Pour y remédier, nous avons proposé deux extensions, une stratégie d’intégration modulée par la forme pour minimiser les erreurs aux discontinuités de texture et un schéma de régression pour le décodage. Ces extensions ont amélioré la précision de l'estimation, mais aussi souligné à nouveau le débat sur le rôle des différents types de cellules dans le codage mouvement, par exemple le rôle relatif des cellules “pattern” par rapport aux cellules “component”. Pour comprendre cela, nous avons utilisé un modèle de champs neuronaux représentant une population de cellules MT pour comprendre le rôle des récurrences. Nos résultats montrent qu'une variété de comportements peuvent être reproduits, ils expliquent les changements dynamiques en fonction des stimuli, et nous conduisent à remettre en cause les régimes élevés d'inhibition généralement choisis dans la littérature. In this thesis, we studied the problem of motion estimation in mammals and propose that scaling up models rooted in biology for real world applications can give us fresh insights into the biological vision. Using a classic model that describes the activity of directionally-selective neurons in V1 and MT areas of macaque brain, we proposed a feedforward V1-MT architecture for motion estimation and benchmarked it on computer vision datasets (first publicly available evaluation for this kind of models), revealing interesting shortcomings such as lack of selectivity at motion boundaries and lack of spatial association of the flow field. To address these, we proposed two extensions, a form modulated pooling strategy to minimize errors at texture boundaries and a regression based decoding scheme. These extensions improved estimation accuracy but also reemphasized the debate about the role of different cell types (characterized by their tuning curves) in encoding motion, for example relative role of pattern cells versus component cells. To understand this, we used a phenomenological neural fields model representative of a population of directionally tuned MT cells to check whether different tuning behaviors could be reproduced by a recurrently interacting population or if we need different types of cells explicitly. Our results indicated that a variety of tuning behavior can be reproduced by a minimal network, explaining dynamical changes in the tuning with change of stimuli leading us to question the high inhibition regimes typically considered by models in the literature. Electronic Thesis or Dissertation Text en http://www.theses.fr/2016AZUR4127/document Medathati, Naga Venkata Kartheek 2016-12-13 Côte d'Azur Kornprobst, Pierre Masson, Guillaume S.
collection NDLTD
language en
sources NDLTD
topic Flux optique
Perception du mouvement
Dynamique MT
Théorie de la bifurcation
Vision par ordinateur biologiquement inspirée
Optical flow
Motion perception
MT dynamics
Bifurcation theory
Neural fields
Biologically inspired computer vision

spellingShingle Flux optique
Perception du mouvement
Dynamique MT
Théorie de la bifurcation
Vision par ordinateur biologiquement inspirée
Optical flow
Motion perception
MT dynamics
Bifurcation theory
Neural fields
Biologically inspired computer vision

Medathati, Naga Venkata Kartheek
Vers des modèles synergiques de l’estimation du mouvement en vision biologique et artificielle
description Dans cette thèse, nous avons étudié le problème de l'estimation de mouvement chez les mammifères et nous proposons que passer à l’échelle des modèles ancrés dans la biologie pour les applications du monde réel peut nous donner de nouvelles perspectives en vision biologique. En utilisant un modèle classique qui décrit l'activité des neurones dans les aires corticales V1 et MT du cerveau des primates, nous avons proposé une architecture montante pour l'estimation de mouvement et l’avons évaluée sur des exemples de référence de vision par ordinateur (une première pour ce type de modèles), révélant des lacunes telles que le manque de sélectivité au niveau des frontières de mouvement et l'absence d'association spatiale du champ de vitesses. Pour y remédier, nous avons proposé deux extensions, une stratégie d’intégration modulée par la forme pour minimiser les erreurs aux discontinuités de texture et un schéma de régression pour le décodage. Ces extensions ont amélioré la précision de l'estimation, mais aussi souligné à nouveau le débat sur le rôle des différents types de cellules dans le codage mouvement, par exemple le rôle relatif des cellules “pattern” par rapport aux cellules “component”. Pour comprendre cela, nous avons utilisé un modèle de champs neuronaux représentant une population de cellules MT pour comprendre le rôle des récurrences. Nos résultats montrent qu'une variété de comportements peuvent être reproduits, ils expliquent les changements dynamiques en fonction des stimuli, et nous conduisent à remettre en cause les régimes élevés d'inhibition généralement choisis dans la littérature. === In this thesis, we studied the problem of motion estimation in mammals and propose that scaling up models rooted in biology for real world applications can give us fresh insights into the biological vision. Using a classic model that describes the activity of directionally-selective neurons in V1 and MT areas of macaque brain, we proposed a feedforward V1-MT architecture for motion estimation and benchmarked it on computer vision datasets (first publicly available evaluation for this kind of models), revealing interesting shortcomings such as lack of selectivity at motion boundaries and lack of spatial association of the flow field. To address these, we proposed two extensions, a form modulated pooling strategy to minimize errors at texture boundaries and a regression based decoding scheme. These extensions improved estimation accuracy but also reemphasized the debate about the role of different cell types (characterized by their tuning curves) in encoding motion, for example relative role of pattern cells versus component cells. To understand this, we used a phenomenological neural fields model representative of a population of directionally tuned MT cells to check whether different tuning behaviors could be reproduced by a recurrently interacting population or if we need different types of cells explicitly. Our results indicated that a variety of tuning behavior can be reproduced by a minimal network, explaining dynamical changes in the tuning with change of stimuli leading us to question the high inhibition regimes typically considered by models in the literature.
author2 Côte d'Azur
author_facet Côte d'Azur
Medathati, Naga Venkata Kartheek
author Medathati, Naga Venkata Kartheek
author_sort Medathati, Naga Venkata Kartheek
title Vers des modèles synergiques de l’estimation du mouvement en vision biologique et artificielle
title_short Vers des modèles synergiques de l’estimation du mouvement en vision biologique et artificielle
title_full Vers des modèles synergiques de l’estimation du mouvement en vision biologique et artificielle
title_fullStr Vers des modèles synergiques de l’estimation du mouvement en vision biologique et artificielle
title_full_unstemmed Vers des modèles synergiques de l’estimation du mouvement en vision biologique et artificielle
title_sort vers des modèles synergiques de l’estimation du mouvement en vision biologique et artificielle
publishDate 2016
url http://www.theses.fr/2016AZUR4127/document
work_keys_str_mv AT medathatinagavenkatakartheek versdesmodelessynergiquesdelestimationdumouvementenvisionbiologiqueetartificielle
AT medathatinagavenkatakartheek towardssynergisticmodelsofmotioninformationprocessinginbiologicalandartificialvision
_version_ 1719303746571206656