Estimation du regard à partir de la vidéo - Université de Lille Accéder directement au contenu
Thèse Année : 2015

Gaze estimation from video

Estimation du regard à partir de la vidéo

Résumé

The aim of this thesis is to estimate the pose of a human head from monocular images. The goal is to have a feedback from the user on the direction of his gaze, and this is done in a non-intrusive manner. This area of research is very active given the evolution of the communication interfaces between a human and a machine, especially as many challenges are still there. In particular, the robustness of the system, its invariance to the identity of individuals and enlightenment. The approach we propose is based on the bilateral symmetry of the face. We use features extracted from the symmetry to estimate head pose through learning. The features used are geometric but extracted holistically from the whole texture of the face, without the need for specific points or contours. These features have been experimentally validated by means of publicly available databases of images and videos dedicated to head pose estimation. Supervised learning and regression have been used to build models of poses. These models have been tested on video sequences different from the bases used for learning. The estimation error has been calculated and the results are superior or equivalent to the state of the art.
L’objectif de cette thèse est l’estimation de la pose de la tête humaine à partir d’images monoculaires. Le but est d’avoir un retour d’information de l’utilisateur sur l’orientation de son regard, et ce, de manière non-intrusive. Ce domaine de recherche est très actif compte tenu de l’évolution des interfaces de communication entre l’homme et la machine, d’autant plus que plusieurs défis sont toujours ouverts. Notamment, la robustesse du système, son invariabilité à l’identité des personnes et à l’illumination ainsi que la qualité du matériel de capture requis. L’approche que nous avons proposée est basée sur la symétrie bilatérale du visage. Nous utilisons des caractéristiques extraites de la symétrie pour estimer la pose de la tête par le biais de l’apprentissage. Les caractéristiques utilisées sont géométriques mais extraites de manière globale à partir de toute la texture du visage, sans que des points ou des contours spécifiques ne soient requis. Ces caractéristiques ont été validées expérimentalement à l’aide de bases d’images et de vidéos publiques dédiées à l’estimation de la pose de la tête. L’apprentissage supervisé ainsi que la régression sont utilisés pour construire des modèles de poses. Ces modèles ont été testés sur des séquences vidéo indépendantes des bases utilisées pour l’apprentissage. L’erreur d’estimation a été calculée et les résultats sont supérieurs ou équivalents à l’état de l’art.
Fichier principal
Vignette du fichier
Thèse-Afifa-Dahmane-Lille1.pdf (15.94 Mo) Télécharger le fichier
Thèse-Afifa-Dahmane-Lille1 (1).pdf (16.73 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-01703903 , version 1 (08-02-2018)

Identifiants

  • HAL Id : tel-01703903 , version 1

Citer

Afifa Dahmane. Estimation du regard à partir de la vidéo. Vision par ordinateur et reconnaissance de formes [cs.CV]. Université de Lille 1, Sciences et Technologies; CRIStAL UMR 9189; Université des Sciences et Technologies Houari Boumediene (USTHB), Alger, 2015. Français. ⟨NNT : ⟩. ⟨tel-01703903⟩
115 Consultations
63 Téléchargements

Partager

Gmail Facebook X LinkedIn More