Dimension reduction in regression

François Portier

Thèse Année : 2013

Dimension reduction in regression

Réduction de la dimension en régression

(1)

François Portier

Fonction : Auteur
PersonId : 770268
IdRef : 171122240

Institut de Recherche Mathématique de Rennes

Résumé

In this thesis, we study the problem of dimension reduction through the following regression model Y=g(BX,e), where X is a p dimensional vector, Y belongs to R, the function g is unknown and the noise e is independent of X. We are interested in the estimation of the matrix B, with dimension d times p where d is smaller than p (whose knowledge provides good convergence rates for the estimation of g). This problem is processed according to two different approaches. The first one, called the inverse regression, needs the linearity condition on X. The second one, called semiparametric, do not require such an assumption but only that X has a smooth density. In the context of inverse regression, we focus on two families of methods respectively based on E[X f(Y)] and E[XX^T f(Y)]. For both families, we provide conditions on f that allow an exhaustive estimation of B, and also we compute the better function f by minimizing the asymptotic variance. In the semiparametric context, we give a method for the estimation of the gradient of the regression function. Under some classical semiparametric assumptions, we show the root n consistency of our estimator, the exhaustivity of the estimation and the convergence in the processes space. Within each point, an important question is raised : how to choose the dimension of B ? For this we propose a method that estimates of the rank of a matrix by bootstrap hypothesis testing.

Dans cette thèse, nous étudions le problème de réduction de la dimension dans le cadre du modèle de régression suivant Y=g(B X,e), où X est un vecteur de dimension p, Y appartient à R, la fonction g est inconnue et le bruit e est indépendant de X. Nous nous intéressons à l'estimation de la matrice B, de taille dxp où d est plus petit que p, (dont la connaissance permet d'obtenir de bonnes vitesses de convergence pour l'estimation de g). Ce problème est traité en utilisant deux approches distinctes. La première, appelée régression inverse nécessite la condition de linéarité sur X. La seconde, appelée semi-paramétrique ne requiert pas une telle condition mais seulement que X possède une densité lisse. Dans le cadre de la régression inverse, nous étudions deux familles de méthodes respectivement basées sur E[X f(Y)] et E[XX^T f(Y)]. Pour chacune de ces familles, nous obtenons les conditions sur f permettant une estimation exhaustive de B, aussi nous calculons la fonction f optimale par minimisation de la variance asymptotique. Dans le cadre de l'approche semi-paramétrique, nous proposons une méthode permettant l'estimation du gradient de la fonction de régression. Sous des hypothèses semi-paramétriques classiques, nous montrons la normalité asymptotique de notre estimateur et l'exhaustivité de l'estimation de B. Quel que soit l'approche considérée, une question fondamentale est soulevée : comment choisir la dimension de B ? Pour cela, nous proposons une méthode d'estimation du rang d'une matrice par test d'hypothèse bootstrap.

Mots clés

Sufficient dimension reduction Inverse regression Multiple index model Average derivative estimator.

Réduction de la dimension en régression Régression inverse Modèle à directions révélatrices Estimation du gradient de la régression.

Domaines

Mathématiques générales [math.GM]

Fichier principal

PORTIER_Francois.pdf (1.7 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-00871049

Soumis le : mardi 8 octobre 2013-16:27:35

Dernière modification le : vendredi 19 avril 2024-14:31:30

Archivage à long terme le : jeudi 9 janvier 2014-04:33:00

Dates et versions

tel-00871049 , version 1 (08-10-2013)

Identifiants

HAL Id : tel-00871049 , version 1

Citer

François Portier. Dimension reduction in regression. General Mathematics [math.GM]. Université de Rennes, 2013. English. ⟨NNT : 2013REN1S039⟩. ⟨tel-00871049⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 IRMAR UR2-HB CNRS UR2-HB-T INSA-RENNES IRMAR-THESE STAR UNAM IRMAR-STAT UR1-THESES UR1-MATH-STIC UNIV-RENNES2 UNIV-RENNES INSA-GROUPE UR1-MATH-NUM

509 Consultations

321 Téléchargements

Dimension reduction in regression

Réduction de la dimension en régression

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager