Contribution des méthodes d'apprentissage à la distribution de tâches dans un cluster robotique

Paul Gautier

Thèse Année : 2021

Contribution of learning methods to task distribution in a robotic cluster

Contribution des méthodes d'apprentissage à la distribution de tâches dans un cluster robotique

(1)

Paul Gautier

Fonction : Auteur

Equipe Software/HArdware and unKnown Environment inteRactions

Résumé

The multi-robot systems coordination is a complex task requiring the execution of computationaly intensive algorithms. Therefore, the robot's computing resources become a major concern since they condition the system's ability to interact with the environment. While the use of the robotic cloud removes this limitation, its use remains conditional and intractable in many cases. Another solution consists of organizing the multi-robot system into a robotic cluster where the unused resources are pooled in order to parallelize the highly computational tasks. However, these pooled resources turn out to be limited and fluctuating, requiring the implementation of a dynamic allocation process. These thesis works are devoted to the contributions of reinforcement learning in the administration of a robotic cluster operating in a dynamic and uncertain environment. In a new context called MRpTA, two axis are studied: The first deals with the transfer of tasks within a cluster where classical approaches are compared to a DQN solution. The second axis addresses, in a search and rescue context, the question of the distribution of tasks within a cluster. The use of reinforcement learning drastically improves the system performance.

La coordination d'un système multi-robots est une tâche complexe nécessitant l'exécution d'algorithmes de calcul intensif. Dès lors, les ressources calculatoires du robot deviennent une préoccupation majeure puisqu'elles conditionnent la capacité du système à interagir avec l'environnement. Si le recours au cloud robotique permet de s'affranchir de cette difficulté, son utilisation demeure conditionnelle et impraticable dans de nombreux cas. Une autre solution consiste à organiser le système multi-robots en un cluster robotique où les ressources non-utilisées sont mutualisées afin de paralléliser les tâches fortement calculatoires. Cependant, ces ressources mutualisées s'avèrent limitées et fluctuantes nécessitant la mise en place d'un processus d'allocation dynamique. Ces travaux de thèse sont consacrés aux apports de l'apprentissage par renforcement dans l'administration d'un cluster robotique évoluant dans un environnement dynamique et incertain. Dans un nouveau contexte appelé MRpTA, deux axes sont étudiés : Le premier traite du transfert de tâches au sein d'un cluster où des approches classiques sont comparées à une solution utilisant un DQN. Le deuxième axe aborde, dans un contexte de recherche et sauvetage, la question de la distribution des tâches au sein d'un cluster. Le recours à l'apprentissage par renforcement permet d'améliorer considérablement les performances du système.

Mots clés

Deep Q-learning Cluster robotique

MRTA

Domaines

Robotique [cs.RO] Intelligence artificielle [cs.AI]

Fichier principal

2020theseGautierP.pdf (2.97 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-03276733

Soumis le : vendredi 2 juillet 2021-13:00:10

Dernière modification le : vendredi 22 mars 2024-15:01:12

Archivage à long terme le : dimanche 3 octobre 2021-19:14:51

Dates et versions

tel-03276733 , version 1 (02-07-2021)

Identifiants

HAL Id : tel-03276733 , version 1

Citer

Paul Gautier. Contribution des méthodes d'apprentissage à la distribution de tâches dans un cluster robotique. Robotique [cs.RO]. Université de Bretagne Sud, 2021. Français. ⟨NNT : 2021LORIS591⟩. ⟨tel-03276733⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-BREST INSTITUT-TELECOM CNRS STAR LAB-STICC_UBO UBS LAB-STICC_UBS ENIB LAB-STICC LAB-STICC_UBS_2 LAB-STICC_SHAKER LAB-STICC_SHARP

193 Consultations

148 Téléchargements

Contribution of learning methods to task distribution in a robotic cluster

Contribution des méthodes d'apprentissage à la distribution de tâches dans un cluster robotique

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager