Au feu, au feu les pompiers! ... Oui mais lesquels ?
Dans le cadre d’une thèse CIFRE avec le SDIS31 (pompiers de Haute-Garonne), je cherche à optimiser l’affectation du personnel qui doit partir en intervention. Pour cela, j’implémente un agent d’apprentissage par renforcement profond (Deep Reinforcement Learning) qui apprend à affecter le personnel au sein d’un jumeau numérique de la Haute-Garonne (simulation des casernes, véhicules et personnels), en interagissant avec un générateur d’interventions, implémenté lui à l’aide d’un modèle de diffusion tabulaire. Le but est d’améliorer le système actuel, qui utilise un arbre décisionnel, en prenant en compte la situation globale du département, les distributions de probabilités des interventions à venir ainsi que l’ensemble des véhicules qui doivent partir en intervention.
Ces travaux sont réalisés dans le cadre d’une thèse intitulée « Optimisation multicritère explicable d’un plan d’intervention par apprentissage artificiel » financée par le SDIS 31 et l’ANR et encadrée par Emmanuelle Claeys, Mathieu Serrurier et Pascale Zaraté