Prise en compte de la dépendance pour des problèmes de test global et de prédiction - Statistique Accéder directement au contenu
Thèse Année : 2019

Dependence handling for global testing and prediction problems

Prise en compte de la dépendance pour des problèmes de test global et de prédiction

Résumé

In various types of data, including genomic or functional data, explanatory variables are characterized by a strong dependence structure. For diverse problems, such as global testing or for the construction of prediction rules, handling this dependence structure remains an open issue. Several authors recommend to properly take the dependence into account, whereas others propose to completely ignore it. It appears that the best choice depends on both the dependence structure itself and the pattern of the association signal between the explanatory variables and the response. In this thesis, adaptive approaches are proposed, aiming at determining the best way to handle dependence.An adaptive global testing method is therefore constructed, namely for gene testing problems in genomewide association studies. Similarly, an adaptive regression rule is developed. In both cases, the flexible handling of dependence is performed by the introduction of weights. An explicit expression for the optimal weights is then derived, which depends on both the dependence structure of the explanatory variables and the association signal. The results obtained in simulation studies and on non-simulated datasets demonstrate that the proposed methods perform well in various situations.
Dans de nombreux types de données, tels que les données génomiques ou fonctionnelles, les variables explicatives sont caractérisées par une forte structure de dépendance. Pour des problèmes variés, comme la construction de tests globaux ou de règles de prédiction, la prise en compte de cette structure de dépendance reste un problème ouvert. Plusieurs auteurs recommandent de prendre explicitement en compte cette dépendance, tandis que d’autres proposent de l’ignorer complètement. En réalité, il apparaît que le meilleur choix entre ces deux possibilités dépend à la fois de la structure de dépendance elle-même, mais aussi de la forme du signal d’association entre les variables explicatives et la variable réponse. Dans cette thèse, des approches adaptatives sont proposées, visant à déterminer la meilleure façon de prendre en compte la dépendance.Une méthode de test global est construite, notamment pour les problèmes de tests d’association gène-phénotype en études d’association pangénomiques. De façon similaire, une règle de régression adaptative est développée. Dans les deux cas, la prise en compte adaptative de la dépendance est permise par l’introduction de poids. Une expression explicite des poids optimaux est ensuite obtenue. Celle-ci dépend à la fois de la structure de dépendance des variables explicatives et du signal d’association. Les résultats obtenus sur des simulations et des jeux de données non simulés démontrent que les méthodes proposées offrent de bonnes performances dans des situations variées.
Fichier principal
Vignette du fichier
fix_ajqiPLTT-hebert.pdf (2.7 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03585062 , version 1 (22-02-2022)

Identifiants

  • HAL Id : tel-03585062 , version 1

Citer

Florian Hébert. Prise en compte de la dépendance pour des problèmes de test global et de prédiction. Statistiques [math.ST]. Agrocampus Ouest, 2019. Français. ⟨NNT : 2019NSARG018⟩. ⟨tel-03585062⟩
174 Consultations
68 Téléchargements

Partager

Gmail Facebook X LinkedIn More