Exploitation de la multimodalité pour l'analyse de la saillance et l'évaluation de la qualité audiovisuelle

Les données audiovisuelles font partie de notre quotidien que ce soit pour des besoins professionnels ou tout simplement pour le loisir. Les quantités pléthoriques de ces données imposent un recours à la compression pour le stockage ou la diffusion, ce qui peut altérer la qualité audio-visuelle si l...

Full description

Bibliographic Details
Main Author: Sidaty, Naty
Other Authors: Poitiers
Language:fr
Published: 2015
Subjects:
Online Access:http://www.theses.fr/2015POIT2309/document
id ndltd-theses.fr-2015POIT2309
record_format oai_dc
spelling ndltd-theses.fr-2015POIT23092019-12-11T15:22:41Z Exploitation de la multimodalité pour l'analyse de la saillance et l'évaluation de la qualité audiovisuelle Exploitation of multimodality for saliency analysis and audiovisual quality assessment Saillance audiovisuelle Expérimentations oculométriques Qualité multimodale Compression Audiovisual saliency Eye-Tracking experiments Multimodal quality Compression 006.42 Les données audiovisuelles font partie de notre quotidien que ce soit pour des besoins professionnels ou tout simplement pour le loisir. Les quantités pléthoriques de ces données imposent un recours à la compression pour le stockage ou la diffusion, ce qui peut altérer la qualité audio-visuelle si les aspects perceptuels ne sont pas pris en compte. L’état de l’art sur la saillance et la qualité est très riche, ignorant souvent l’existence de la composante audio qui a un rôle important dans le parcours visuel et la qualité de l’expérience. Cette thèse a pour objectif de contribuer à combler le manque d’approches multimodales et ce, en suivant une démarche expérimentale dédiée. Les travaux associés se déclinent en deux parties : l’attention audiovisuelle et la qualité multimodale. Tout d'abord, afin de comprendre et d’analyser l’influence de l’audio sur les mouvements oculaires humains, nous avons mené une expérimentation oculométriques impliquant un panel d’observateurs, et exploitant une base de vidéos construite pour ce contexte. L'importance des visages a ainsi été confortée mais en particulier pour les visages parlants qui ont une saillance accrue. Sur la base de ces résultats, nous avons proposé un modèle de saillance audiovisuelle basé sur la détection des locuteurs dans la vidéo et exploitant les informations de bas niveau spatiales et temporelles. Par la suite, nous avons étudié l’influence de l’audio sur la qualité multimodale et multi-­supports. A cette fin, des campagnes d’évaluations psychovisuelles ont été menées dans l’optique de quantifier la qualité multimodale pour des applications de streaming vidéo où différents dispositifs de visualisation sont utilisés. Audiovisual information are part of our daily life either for professional needs or simply for leisure purposes. The plethoric quantity of data requires the use of compression for both storage and transmission, which may alter the audiovisual quality if it does not account for perceptual aspects. The literature on saliency and quality is very rich, often ignoring the audio component playing an important role in the visual scanpath and the quality of experience. This thesis aims at contributing in overing the lack of multimodal approaches, by following a dedicated experimental procedures. The proposed work is twofold: visual attention modelling and multimodal quality evaluation. First, in order to better understand and analyze the influence of audio on humain ocular movements, we run several eyetracking experiments involving a panel of observers and exploiting a video dataset constructed for our context. The importance of faces has been confirmed, particularly for talking faces having an increased saliency. Following these results, we proposed an audiovisual saliency model based on locutors detection in video and relying on spatial and temporal low-­level features. Afterward, the influence of audio on multi-modal and multi-devices quality has been studied. To this end, psychovisual experiments have been conducted with the aim to quantify the multimodal quality in the context of video streaming applications where various display devices could be used. Electronic Thesis or Dissertation Text Image StillImage fr http://www.theses.fr/2015POIT2309/document Sidaty, Naty 2015-12-11 Poitiers Saadane, Abdelhakim Larabi, Mohamed-Chaker
collection NDLTD
language fr
sources NDLTD
topic Saillance audiovisuelle
Expérimentations oculométriques
Qualité multimodale
Compression
Audiovisual saliency
Eye-Tracking experiments
Multimodal quality
Compression
006.42
spellingShingle Saillance audiovisuelle
Expérimentations oculométriques
Qualité multimodale
Compression
Audiovisual saliency
Eye-Tracking experiments
Multimodal quality
Compression
006.42
Sidaty, Naty
Exploitation de la multimodalité pour l'analyse de la saillance et l'évaluation de la qualité audiovisuelle
description Les données audiovisuelles font partie de notre quotidien que ce soit pour des besoins professionnels ou tout simplement pour le loisir. Les quantités pléthoriques de ces données imposent un recours à la compression pour le stockage ou la diffusion, ce qui peut altérer la qualité audio-visuelle si les aspects perceptuels ne sont pas pris en compte. L’état de l’art sur la saillance et la qualité est très riche, ignorant souvent l’existence de la composante audio qui a un rôle important dans le parcours visuel et la qualité de l’expérience. Cette thèse a pour objectif de contribuer à combler le manque d’approches multimodales et ce, en suivant une démarche expérimentale dédiée. Les travaux associés se déclinent en deux parties : l’attention audiovisuelle et la qualité multimodale. Tout d'abord, afin de comprendre et d’analyser l’influence de l’audio sur les mouvements oculaires humains, nous avons mené une expérimentation oculométriques impliquant un panel d’observateurs, et exploitant une base de vidéos construite pour ce contexte. L'importance des visages a ainsi été confortée mais en particulier pour les visages parlants qui ont une saillance accrue. Sur la base de ces résultats, nous avons proposé un modèle de saillance audiovisuelle basé sur la détection des locuteurs dans la vidéo et exploitant les informations de bas niveau spatiales et temporelles. Par la suite, nous avons étudié l’influence de l’audio sur la qualité multimodale et multi-­supports. A cette fin, des campagnes d’évaluations psychovisuelles ont été menées dans l’optique de quantifier la qualité multimodale pour des applications de streaming vidéo où différents dispositifs de visualisation sont utilisés. === Audiovisual information are part of our daily life either for professional needs or simply for leisure purposes. The plethoric quantity of data requires the use of compression for both storage and transmission, which may alter the audiovisual quality if it does not account for perceptual aspects. The literature on saliency and quality is very rich, often ignoring the audio component playing an important role in the visual scanpath and the quality of experience. This thesis aims at contributing in overing the lack of multimodal approaches, by following a dedicated experimental procedures. The proposed work is twofold: visual attention modelling and multimodal quality evaluation. First, in order to better understand and analyze the influence of audio on humain ocular movements, we run several eyetracking experiments involving a panel of observers and exploiting a video dataset constructed for our context. The importance of faces has been confirmed, particularly for talking faces having an increased saliency. Following these results, we proposed an audiovisual saliency model based on locutors detection in video and relying on spatial and temporal low-­level features. Afterward, the influence of audio on multi-modal and multi-devices quality has been studied. To this end, psychovisual experiments have been conducted with the aim to quantify the multimodal quality in the context of video streaming applications where various display devices could be used.
author2 Poitiers
author_facet Poitiers
Sidaty, Naty
author Sidaty, Naty
author_sort Sidaty, Naty
title Exploitation de la multimodalité pour l'analyse de la saillance et l'évaluation de la qualité audiovisuelle
title_short Exploitation de la multimodalité pour l'analyse de la saillance et l'évaluation de la qualité audiovisuelle
title_full Exploitation de la multimodalité pour l'analyse de la saillance et l'évaluation de la qualité audiovisuelle
title_fullStr Exploitation de la multimodalité pour l'analyse de la saillance et l'évaluation de la qualité audiovisuelle
title_full_unstemmed Exploitation de la multimodalité pour l'analyse de la saillance et l'évaluation de la qualité audiovisuelle
title_sort exploitation de la multimodalité pour l'analyse de la saillance et l'évaluation de la qualité audiovisuelle
publishDate 2015
url http://www.theses.fr/2015POIT2309/document
work_keys_str_mv AT sidatynaty exploitationdelamultimodalitepourlanalysedelasaillanceetlevaluationdelaqualiteaudiovisuelle
AT sidatynaty exploitationofmultimodalityforsaliencyanalysisandaudiovisualqualityassessment
_version_ 1719302855340326912