Trade-off between prediction and FDR for high-dimensional Gaussian model selection - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2023

Trade-off between prediction and FDR for high-dimensional Gaussian model selection

Compromis entre la prédiction et le FDR pour la sélection de modèles Gaussiens en grande dimension

Résumé

In the context of the high-dimensional Gaussian linear regression for ordered variables, we study the variable selection procedure via the minimization of the penalized least-squares criterion. We focus on model selection where we propose to control predictive risk and False Discovery Rate simultaneously. For this purpose, we obtain a convenient trade-off thanks to a proper calibration of the hyperparameter K appearing in the penalty function. We obtain non-asymptotic theoretical bounds on the False Discovery Rate with respect to K. We then provide an algorithm for the calibration of K. It is based on completely observable quantities in view of applications. Our algorithm is validated by an extensive simulation study.
Dans le contexte de la régression linéaire gaussienne de grande dimension pour des variables ordonnées, nous étudions la procédure de sélection des variables via la minimisation du critère des moindres carrés pénalisés. Nous nous concentrons sur la sélection de modèles où nous proposons de contrôler simultanément le risque prédictif et le taux de fausses découvertes. À cette fin, nous obtenons un bon compromis à travers une calibration judicieuse de l'hyperparamètre K apparaissant dans la fonction de pénalité. Nous obtenons des bornes théoriques non-asymptotiques sur le taux de fausses découvertes en fonction de K. Nous proposons ensuite un algorithme pour la calibration de K. Il est basé sur des quantités complètement observables et est ainsi adapté pour des applications sur données réelles. Notre algorithme est validé par une large étude de simulation extensive.
Fichier principal
Vignette du fichier
ArXiv_paper.pdf (913.3 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03978309 , version 1 (08-02-2023)
hal-03978309 , version 2 (27-07-2023)
hal-03978309 , version 3 (11-04-2024)

Identifiants

Citer

Perrine Lacroix, Marie-Laure Martin. Trade-off between prediction and FDR for high-dimensional Gaussian model selection. 2023. ⟨hal-03978309v1⟩
185 Consultations
41 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More