Vincent Thomas

Activités de recherche

Mes activités de recherche se focalisent sur trois points

La prise de décision en environnement incertain à partir des modèles de décisions markoviens. A savoir comment prendre de bonnes décisions dans un environnement stochastique et partiellement connu ?
La prise de décision et l'apprentissage dans les systèmes multi-agents. A savoir comment apprendre à plusieurs sachant que ma meilleure décision dépend des actions de l'autre ?
La modélisation de phènomènes collectifs observés en biologie. A savoir, comment reproduire sur substrat informatique l'apparition d'organisations observées dans des sociétés animales ?

Mots clefs: Intelligence artificielle, Systeme multi-agent, Inspiration biologique, Processus de Decision Markovien, Apprentissage, Simulation de phénomène collectif.

Thematiques

Suit une présentation des divers travaux effectués, chaque page dédiée possede une description précise, des liens vers les articles consacrés, des liens vers des sites connexes et la possibilité d'acceder à des demonstrations.

Construction collective de toiles et analyse d'image

Mots clefs:
Inspiration biologique, Systeme multi-agents, Analyse images, Araignée sociale.

Résume:
Parmi les milliers d'especes d'araignées, seule une trentaine d'especes sont sociales, caractérisées par le fait que les araignées forment de grands groupes constitués de milliers d'inidvidus et effectuent des activités collectives coordonnées.

Le comportement de construction collective de toiles avait été modélisé par Vincent Chevrier et Christine Bourjot dans l'équipe MAIA, et une partie de mes activités de recherche s'est focalisée sur la transposition de ce modèle à l'analyse d'images et l'extraction de region.

==> Page sur les Araignées Sociales

Extraction de la chevelure à l'aide d'araignées virtuelles

Différenciation comportementale dans des groupes de rats

Mots clefs:
Simulation, Inspiration biologique, Systeme multi-agents, Auto-organisation, Differenciation.

Résumé:
Lorsque des rats sont soumis à des contraintes d'accés à la nourriture, une differenciation comportementale apparait au sein du groupe: certains rats accedent directement à la nourriture tandis que d'autres se nourrissent en volant la nourriture des précédents.

Dans le cadre de ma thèse, je me suis intéressé à modèliser ce phènomène collectif pour essayer de comprendre comment des sociétés pouvaient s'organiser et s'il était possible d'abstraire un mécanisme réutilisable en informatique. Ces travaux ont conduit à l'élaboration du modele Hamelin.

==> Page sur le Modèle Hamelin.

Specialisation du rat bleu dans Hamelin (cf lien pour l'application)

Apprentissage multi-agent et Interac-DECPOMDP

Mots clefs:
Apprentissage par renforcement, Systeme multi-agents, Auto-organisation, Markov Decision Process, DECPOMDP.

Résume:
Lorsque plusieurs agents doivent apprendre collectivement à résoudre un problème de manière décentralisée, ils sont confrontés à de nombreuses difficultés, en particulier, le fait que la meilleure action d'un agent dépend des actions entreprises par les autres agents.

Mon travail de thèse a été de proposer un nouveau cadre formel l'interac-DEC-POMDP dans lequel les agents peuvent interagir directement entre eux pour prendre des décisions à plusieurs. Des algorithmes ont en outre été proposés pour permettre de tirer parti de ces interactions pour construire automatiquement des comportements collectifs.

==> Page sur l'Interac-DEC-POMDP

Agents qui apprennent à faire des chaines pour eteindre un feu

Active sensing et POMDP

Mots clefs:
Processus de Decision Markovien, Active sensing, Perceptions partielles, POMDP, Aide au diagnostic.

Résume:
Le domaine de l'active sensing se concentre sur des problèmes dans lesquels on ne dispose que d'information partielle. Dans ces problèmes, les agents, au fur et à mesure de leurs actions, recoivent de nouvelles perceptions leur permettant de mettre à jour leurs connaissances et d'atteindre plus facilement leur objectif.

La difficulté réside dans le fait que chaque action doit être considérée comme un moyen de résoudre directement le probleme, mais aussi comme un moyen d'acquérir de nouvelles informations qui pourront être utiles sur le long terme. Ce travail en est actuellement à ses débuts et je co-encadre avec Olivier Buffet et Francois Charpillet la thèse de Mauricio Araya sur ce sujet.

==> Page sur l'Active Sensing

Le chasseur (rouge) cherche une proie (vert) dissimulée dans un labyrinthe