|
|
Activités de recherche
Mes activités de recherche se focalisent sur trois points
- La prise de décision en environnement incertain à partir des
modèles de décisions markoviens. A savoir comment prendre de bonnes
décisions dans un environnement stochastique et partiellement connu ?
- La prise de décision et l'apprentissage dans les systèmes
multi-agents. A savoir comment apprendre à plusieurs sachant que ma
meilleure décision dépend des actions de l'autre ?
- La modélisation de phènomènes collectifs observés en
biologie. A savoir, comment reproduire sur substrat informatique
l'apparition d'organisations observées dans des sociétés animales ?
Mots clefs: Intelligence artificielle, Systeme multi-agent,
Inspiration biologique, Processus de Decision Markovien, Apprentissage,
Simulation de phénomène collectif.
Thematiques
Suit une présentation des divers travaux effectués, chaque page dédiée possede une description précise, des liens vers les articles consacrés, des liens vers des sites connexes et la possibilité d'acceder à des demonstrations.
Construction collective de toiles et analyse d'image
Mots clefs:
Inspiration biologique, Systeme multi-agents, Analyse images, Araignée sociale.
Résume: Parmi les milliers d'especes d'araignées, seule une trentaine d'especes
sont sociales, caractérisées par le fait que les araignées forment
de grands groupes constitués de milliers d'inidvidus et effectuent
des activités collectives coordonnées.
Le comportement de construction collective de toiles avait été modélisé
par Vincent Chevrier et Christine Bourjot dans l'équipe MAIA, et une partie
de mes activités de recherche s'est focalisée sur la transposition
de ce modèle à l'analyse d'images et l'extraction de region.
|
|
Extraction de la chevelure à l'aide d'araignées virtuelles
|
Différenciation comportementale dans des groupes de rats
Mots clefs:
Simulation, Inspiration biologique, Systeme multi-agents, Auto-organisation, Differenciation.
Résumé:
Lorsque des rats sont soumis à des contraintes d'accés à la nourriture, une differenciation
comportementale apparait au sein du groupe: certains rats accedent directement à la nourriture
tandis que d'autres se nourrissent en volant la nourriture des précédents.
Dans le cadre de ma thèse, je me suis intéressé à modèliser ce phènomène
collectif pour essayer de comprendre comment des sociétés pouvaient s'organiser
et s'il était possible d'abstraire un mécanisme réutilisable en informatique. Ces travaux ont conduit à l'élaboration du modele Hamelin.
|
|
Specialisation du rat bleu dans Hamelin (cf lien pour l'application)
|
Apprentissage multi-agent et Interac-DECPOMDP
Mots clefs:
Apprentissage par renforcement, Systeme multi-agents, Auto-organisation, Markov Decision Process, DECPOMDP.
Résume:
Lorsque plusieurs agents doivent apprendre collectivement à résoudre un problème de manière décentralisée, ils sont confrontés à de nombreuses difficultés, en particulier, le fait que la meilleure action d'un agent dépend des actions entreprises
par les autres agents.
Mon travail de thèse a été de proposer un nouveau cadre formel l'interac-DEC-POMDP dans lequel les agents peuvent interagir directement entre eux pour prendre des décisions à plusieurs. Des algorithmes ont en outre été proposés pour permettre de tirer parti de ces interactions pour construire automatiquement des comportements collectifs.
|
|
Agents qui apprennent à faire des chaines pour eteindre un feu
|
Active sensing et POMDP
Mots clefs:
Processus de Decision Markovien, Active sensing, Perceptions partielles, POMDP, Aide au diagnostic.
Résume:
Le domaine de l'active sensing se concentre sur des problèmes dans lesquels on ne dispose que d'information partielle. Dans ces problèmes, les agents, au fur et à mesure de leurs actions, recoivent de nouvelles perceptions leur permettant de mettre à jour leurs connaissances et d'atteindre plus facilement leur objectif.
La difficulté réside dans le fait que chaque action doit être considérée comme un moyen de résoudre directement le probleme, mais aussi comme un moyen d'acquérir de nouvelles informations qui pourront être utiles sur le long terme. Ce travail en est actuellement à ses débuts et je co-encadre avec Olivier Buffet et Francois Charpillet la thèse de Mauricio Araya sur ce sujet.
|
|
Le chasseur (rouge) cherche une proie (vert) dissimulée dans un labyrinthe
|
|
| |
|