Contribution des méthodes d'apprentissage à la distribution de tâches dans un cluster robotique - Equipe Software/HArdware and unKnown Environment inteRactions Accéder directement au contenu
Thèse Année : 2021

Contribution of learning methods to task distribution in a robotic cluster

Contribution des méthodes d'apprentissage à la distribution de tâches dans un cluster robotique

Résumé

The multi-robot systems coordination is a complex task requiring the execution of computationaly intensive algorithms. Therefore, the robot's computing resources become a major concern since they condition the system's ability to interact with the environment. While the use of the robotic cloud removes this limitation, its use remains conditional and intractable in many cases. Another solution consists of organizing the multi-robot system into a robotic cluster where the unused resources are pooled in order to parallelize the highly computational tasks. However, these pooled resources turn out to be limited and fluctuating, requiring the implementation of a dynamic allocation process. These thesis works are devoted to the contributions of reinforcement learning in the administration of a robotic cluster operating in a dynamic and uncertain environment. In a new context called MRpTA, two axis are studied: The first deals with the transfer of tasks within a cluster where classical approaches are compared to a DQN solution. The second axis addresses, in a search and rescue context, the question of the distribution of tasks within a cluster. The use of reinforcement learning drastically improves the system performance.
La coordination d'un système multi-robots est une tâche complexe nécessitant l'exécution d'algorithmes de calcul intensif. Dès lors, les ressources calculatoires du robot deviennent une préoccupation majeure puisqu'elles conditionnent la capacité du système à interagir avec l'environnement. Si le recours au cloud robotique permet de s'affranchir de cette difficulté, son utilisation demeure conditionnelle et impraticable dans de nombreux cas. Une autre solution consiste à organiser le système multi-robots en un cluster robotique où les ressources non-utilisées sont mutualisées afin de paralléliser les tâches fortement calculatoires. Cependant, ces ressources mutualisées s'avèrent limitées et fluctuantes nécessitant la mise en place d'un processus d'allocation dynamique. Ces travaux de thèse sont consacrés aux apports de l'apprentissage par renforcement dans l'administration d'un cluster robotique évoluant dans un environnement dynamique et incertain. Dans un nouveau contexte appelé MRpTA, deux axes sont étudiés : Le premier traite du transfert de tâches au sein d'un cluster où des approches classiques sont comparées à une solution utilisant un DQN. Le deuxième axe aborde, dans un contexte de recherche et sauvetage, la question de la distribution des tâches au sein d'un cluster. Le recours à l'apprentissage par renforcement permet d'améliorer considérablement les performances du système.
Fichier principal
Vignette du fichier
2020theseGautierP.pdf (2.97 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03276733 , version 1 (02-07-2021)

Identifiants

  • HAL Id : tel-03276733 , version 1

Citer

Paul Gautier. Contribution des méthodes d'apprentissage à la distribution de tâches dans un cluster robotique. Robotique [cs.RO]. Université de Bretagne Sud, 2021. Français. ⟨NNT : 2021LORIS591⟩. ⟨tel-03276733⟩
193 Consultations
148 Téléchargements

Partager

Gmail Facebook X LinkedIn More