Effet du son dans les vidéos sur la direction du regard : contribution à la modélisation de la saillance audiovisuelle

Les humains reçoivent grande quantité d'informations de l'environnement avec vue et l'ouïe . Pour nous aider à réagir rapidement et correctement, il existe des mécanismes dans le cerveau à l'attention de polarisation vers des régions particulières , à savoir les régions saillants...

Full description

Bibliographic Details
Main Author: Song, Guanghan
Language:fra
Published: Université de Grenoble 2013
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00875651
http://tel.archives-ouvertes.fr/docs/00/95/40/66/PDF/34054_SONG_2013_archivage.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00875651
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-008756512014-10-14T03:32:29Z http://tel.archives-ouvertes.fr/tel-00875651 2013GRENT013 http://tel.archives-ouvertes.fr/docs/00/95/40/66/PDF/34054_SONG_2013_archivage.pdf Effet du son dans les vidéos sur la direction du regard : contribution à la modélisation de la saillance audiovisuelle Song, Guanghan [INFO:INFO_TI] Computer Science/Image Processing [INFO:INFO_TI] Informatique/Traitement des images Attention visuelle Analyse de vidéo Les humains reçoivent grande quantité d'informations de l'environnement avec vue et l'ouïe . Pour nous aider à réagir rapidement et correctement, il existe des mécanismes dans le cerveau à l'attention de polarisation vers des régions particulières , à savoir les régions saillants . Ce biais attentionnel n'est pas seulement influencée par la vision , mais aussi influencée par l'interaction audio - visuelle . Selon la littérature existante , l'attention visuelle peut être étudié à mouvements oculaires , mais l'effet sonore sur le mouvement des yeux dans les vidéos est peu connue . L'objectif de cette thèse est d'étudier l'influence du son dans les vidéos sur le mouvement des yeux et de proposer un modèle de saillance audio - visuel pour prédire les régions saillants dans les vidéos avec plus de précision . A cet effet, nous avons conçu une première expérience audio - visuelle de poursuite oculaire . Nous avons créé une base de données d'extraits vidéo courts choisis dans divers films . Ces extraits ont été consultés par les participants , soit avec leur bande originale (condition AV ) , ou sans bande sonore ( état ​​V) . Nous avons analysé la différence de positions de l'oeil entre les participants des conditions de AV et V . Les résultats montrent qu'il n'existe un effet du bruit sur le mouvement des yeux et l'effet est plus important pour la classe de la parole à l'écran . Ensuite , nous avons conçu une deuxième expérience audiovisuelle avec treize classes de sons. En comparant la différence de positions de l'oeil entre les participants des conditions de AV et V , nous concluons que l'effet du son est différente selon le type de son , et les classes avec la voix humaine ( c'est à dire les classes parole , chanteur , bruit humain et chanteurs ) ont le plus grand effet . Plus précisément , la source sonore a attiré considérablement la position des yeux uniquement lorsque le son a été la voix humaine . En outre , les participants atteints de la maladie de AV avaient une durée moyenne plus courte de fixation que de l'état de V . Enfin , nous avons proposé un modèle de saillance audio- visuel préliminaire sur la base des résultats des expériences ci-dessus . Dans ce modèle , deux stratégies de fusion de l'information audio et visuelle ont été décrits: l'un pour la classe de son discours , et l'autre pour la musique classe de son instrument . Les stratégies de fusion audio - visuelle définies dans le modèle améliore la prévisibilité à la condition AV 2013-06-14 fra PhD thesis Université de Grenoble
collection NDLTD
language fra
sources NDLTD
topic [INFO:INFO_TI] Computer Science/Image Processing
[INFO:INFO_TI] Informatique/Traitement des images
Attention visuelle
Analyse de vidéo
spellingShingle [INFO:INFO_TI] Computer Science/Image Processing
[INFO:INFO_TI] Informatique/Traitement des images
Attention visuelle
Analyse de vidéo
Song, Guanghan
Effet du son dans les vidéos sur la direction du regard : contribution à la modélisation de la saillance audiovisuelle
description Les humains reçoivent grande quantité d'informations de l'environnement avec vue et l'ouïe . Pour nous aider à réagir rapidement et correctement, il existe des mécanismes dans le cerveau à l'attention de polarisation vers des régions particulières , à savoir les régions saillants . Ce biais attentionnel n'est pas seulement influencée par la vision , mais aussi influencée par l'interaction audio - visuelle . Selon la littérature existante , l'attention visuelle peut être étudié à mouvements oculaires , mais l'effet sonore sur le mouvement des yeux dans les vidéos est peu connue . L'objectif de cette thèse est d'étudier l'influence du son dans les vidéos sur le mouvement des yeux et de proposer un modèle de saillance audio - visuel pour prédire les régions saillants dans les vidéos avec plus de précision . A cet effet, nous avons conçu une première expérience audio - visuelle de poursuite oculaire . Nous avons créé une base de données d'extraits vidéo courts choisis dans divers films . Ces extraits ont été consultés par les participants , soit avec leur bande originale (condition AV ) , ou sans bande sonore ( état ​​V) . Nous avons analysé la différence de positions de l'oeil entre les participants des conditions de AV et V . Les résultats montrent qu'il n'existe un effet du bruit sur le mouvement des yeux et l'effet est plus important pour la classe de la parole à l'écran . Ensuite , nous avons conçu une deuxième expérience audiovisuelle avec treize classes de sons. En comparant la différence de positions de l'oeil entre les participants des conditions de AV et V , nous concluons que l'effet du son est différente selon le type de son , et les classes avec la voix humaine ( c'est à dire les classes parole , chanteur , bruit humain et chanteurs ) ont le plus grand effet . Plus précisément , la source sonore a attiré considérablement la position des yeux uniquement lorsque le son a été la voix humaine . En outre , les participants atteints de la maladie de AV avaient une durée moyenne plus courte de fixation que de l'état de V . Enfin , nous avons proposé un modèle de saillance audio- visuel préliminaire sur la base des résultats des expériences ci-dessus . Dans ce modèle , deux stratégies de fusion de l'information audio et visuelle ont été décrits: l'un pour la classe de son discours , et l'autre pour la musique classe de son instrument . Les stratégies de fusion audio - visuelle définies dans le modèle améliore la prévisibilité à la condition AV
author Song, Guanghan
author_facet Song, Guanghan
author_sort Song, Guanghan
title Effet du son dans les vidéos sur la direction du regard : contribution à la modélisation de la saillance audiovisuelle
title_short Effet du son dans les vidéos sur la direction du regard : contribution à la modélisation de la saillance audiovisuelle
title_full Effet du son dans les vidéos sur la direction du regard : contribution à la modélisation de la saillance audiovisuelle
title_fullStr Effet du son dans les vidéos sur la direction du regard : contribution à la modélisation de la saillance audiovisuelle
title_full_unstemmed Effet du son dans les vidéos sur la direction du regard : contribution à la modélisation de la saillance audiovisuelle
title_sort effet du son dans les vidéos sur la direction du regard : contribution à la modélisation de la saillance audiovisuelle
publisher Université de Grenoble
publishDate 2013
url http://tel.archives-ouvertes.fr/tel-00875651
http://tel.archives-ouvertes.fr/docs/00/95/40/66/PDF/34054_SONG_2013_archivage.pdf
work_keys_str_mv AT songguanghan effetdusondanslesvideossurladirectionduregardcontributionalamodelisationdelasaillanceaudiovisuelle
_version_ 1716717053437542400