Le bandit manchot est un algorithme de décision provenant de la théorie des jeux.
Il se propose de tester plusieurs versions d’un même objet (par exemple : une page web) et de conserver celui qui atteint au mieux l’objectif de l’objet. Un test constant reste en production : on a ainsi une proportion de la population qui est soumis à un test (champs exploratoire) , le reste de la population a la version optimale (champs d’exploitation).
On réévalue ainsi la performance de la page en continu. Un thème saisonnier sera par exemple pris en compte automatiquement
Vous souhaitez une explication plus détaillée de ce principe, rendez-vous ici