Classification supervisée et estimation non-paramétique pour les EDS

Orateur:
Type: Thèse
Directeur: Viet-Chi TRAN , Charlotte DION-BLANC
Site: UGE , 4B 125
Salle:
5 BOULEVARD DESCARTES - 77420 CHAMPS-SUR-MARNE
Date de début:
12/12/2023 - 14:30
Date de fin:
12/12/2023 - 16:00

Cette thèse porte sur des études statistiques basées sur les données fonctionnelles modélisées par des équations différentielles stochastiques dont les solutions sont appelées processus de diffusion. Il s’agit plus précisément d’apporter des contributions sur le problème d’estimation non-paramétrique des coefficients d’un processus de diffusion en temps court, et sur la construction de procédures non-paramétriques de classification multi-classes pour les trajectoires de diffusion en temps court. La thèse est divisée en trois principales parties, chacune répondant à une problématique précise. La première partie propose une procédure de classification de type plug-in des trajectoires de diffusion. Nous partons d’un modèle de diffusion dans lequel un processus de diffusion X est solution forte d’une équation différentielle stochastique homogène en temps dont le coefficient de dérive est supposé inconnu et dépend de la classe Y qui est une variable aléatoire discrète de loi inconnue, et le coefficient de diffusion, aussi supposé inconnu, est commun à toutes les classes. On propose, à partir d’un échantillon de taille N constitué d’observations indépendantes du processus de diffusion, un classifieur de type plug-in basé sur des estimateurs non-paramétriques des coefficients de dérive et de diffusion, et de l’estimateur de la loi discrète de l’étiquette Y . Nous prouvons le consistance du classifieur plug-in et établissons une vitesse de convergence de l’ordre de N^{−1/5} dans un cadre plus général, où les coefficients du processus sont des fonctions sont inconnues et lipschitziennes. Nous établissons ensuite des vitesses plus rapides sous des hypothèses plus fortes sur les coefficients de dérive et de diffusion. Dans la deuxième partie de la thèse, on se focalise sur l’estimation non-paramétrique du coef- ficient de diffusion d’une équation différentielle stochastique homogène en temps avec un horizon temporel fini. Deux cadres d’étude sont envisagés. Le premier cadre est celui dans lequel on suppose observer une seule trajectoire de diffusion, et dans le deuxième cadre, on suppose observer N trajec- toires de diffusion générées de manière indépendante. Dans chaque cadre d'étude, nous proposons des estimateurs par projection du carré du coefficient de diffusion respectivement sur un intervalle compact, et sur la droite réelle R par la minimisation d’une fonction de contraste des moindres carrés. Nous établissons la consistance des estimateurs et des vitesses de convergences sous des hypothèses de régularité sur le coefficient de diffusion. La dernière partie traite de la construction d’une procédure non-paramétrique de classification multiclasses de type ERM pour les trajectoires de diffusion. Cette construction repose principalement sur un modèle de diffusion homogène en temps carcatérisé par une équation différentielle stochastique dont les coefficients de dérive et de diffusion sont inconnus. Le coefficient de dérive dépend de l’étiquette Y et le coefficient de diffusion est commun à toutes les classes. L’objectif est de construire un classifieur empirique par la minimisation du risque empirique (ERM) de classification. Nous prouvons la consistance du classifieur de type ERM et établissons une vitesse de convergence de l’ordre de N^{−β/(2β+1)} sur un espace de Hölder de paramètre de régularité β ≥ 1. Nous établissons ensuite, sur le même espace de Hölder de régularité β ≥ 1, une vitesse plus rapide de l’ordre de N^{−4β/3(2β+1)} en classification binaire, grâce à une hypothèse de marge imposée sur la fonction de régression associée au modèle. Mots clefs: classification supervisée, estimation non-paramétrique, trajectoires de diffusion, plug-in, minimisation du risque empirique.