A penalized bandit algorithm - Université Pierre et Marie Curie Accéder directement au contenu
Article Dans Une Revue Electronic Journal of Probability Année : 2008

A penalized bandit algorithm

Résumé

We study a two armed-bandit algorithm with penalty. We show the convergence of the algorithm and establish the rate of convergence. For some choices of the parameters, we obtain a central limit theorem in which the limit distribution is characterized as the unique stationary distribution of a discontinuous Markov process.
Fichier principal
Vignette du fichier
PenalBandit.pdf (293.93 Ko) Télécharger le fichier
Loading...

Dates et versions

hal-00012187 , version 1 (18-10-2005)

Identifiants

Citer

Damien Lamberton, Gilles Pagès. A penalized bandit algorithm. Electronic Journal of Probability, 2008, 13, 341-373 ; http://dx.doi.org/10.1214/EJP.v13-489. ⟨10.1214/EJP.v13-489⟩. ⟨hal-00012187⟩
110 Consultations
224 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More