flag

Proposition d'un formalisme pour la construction automatique d'interactions dans les SMAs réactifs

Soutenue Le 18 Novembre 2005 au LORIA


Documents

Résumé

Cette thèse traite de la conception de système multi-agents. Elle se focalise sur des approches formelles et s'est donné pour objectif à long terme de construire de manière automatique et décentralisée les comportements d'agents coopératifs devant résoudre collectivement un problème. Ce travail a cherché à proposer des méthodes pour construire les comportements d'agents sociaux, capables de prendre en compte à l'exécution la présence d'autres agents dans le système.

Les formalismes existants comme les DEC-POMDPs parviennent à représenter des problèmes multi-agents mais ne représentent pas au niveau individuel la notion d'interaction fondamentale dans les systèmes collectifs. Ceci induit une complexité algorithmique importante dans les algorithmes de résolution. Afin de donner aux agents la possibilité d'appréhender la présence d'autres agents et de structurer de manière implicite les systèmes multi-agents, cette thèse propose un formalisme original, l'interac-DEC-POMDP inspiré des DEC-POMDPs et d'Hamelin, une simulation développée au cours de cette thèse et issue d'expériences conduites en éthologie. La spécificité de ce formalisme réside dans la capacité offerte aux agents d'interagir directement et localement entre eux. Cette possibilité permet des prises de décision à un niveau intermédiaire entre des décisions globales impliquant l'ensemble des agents et des décisions purement individuelles.

Nous avons proposé en outre un algorithme décentralisé basé sur des techniques d'apprentissage par renforcement et une répartition heuristique des gains des agents au cours des interactions. Une démarche expérimentale nous a permis de valider sa capacité à produire pour des restriction du formalisme des comportements collectifs pertinents adaptatifs sans qu'aucun agent ne dispose d'une vue globale du système.


Mots clefs

Système multi-agents, Interaction , Processus décisionnel de Markov, Apprentissage par renforcement, inspiration biologique

Membres du jury

  • Joel Quinqueton, Professeur, Université Paul Valery, Montpellier ( Rapporteur )
  • Philippe Mathieu, Professeur, Université Lille 1 ( Rapporteur )
  • Olivier Sigaud, Professeur, Université Paris 6 ( Examinateur )
  • Didier Galmiche, Professeur, Université UHP Nancy 1 ( Examinateur )
  • Vincent Chevrier, maitre de conference, Université UHP Nancy 1 ( Directeur )
  • Christine Bourjot, maitre de conference, Université Nancy 2 ( Directeur )




 
    last mod. 18/03/2015 Copyright © Vincent Thomas - vthomas@loria.fr