@INPROCEEDINGS{thomas04c,
       CRINNUMBER = {A04-R-110},
       CATEGORY = {4},
       EQUIPE = {MAIA},
       AUTHOR  = {Thomas, Vincent},
       TITLE = {Interac-DEC-MDP \,: un premier formalisme pour l’utilisation d’interactions directes dans un MDP decentralise},
       BOOKTITLE = {{4{\`e}me Journ{\'e}e Processus de D{\'e}cision Markovien et Intelligence Artificielle - PDMIA 2004 et  D{\'e}cision et Planification, Paris, france}},
       YEAR ={ 2004},
       MONTH ={ May},
       KEYWORDS  = {markov decision process, learning, multi-agent system, interaction},
       ABSTRACT  = {Nous proposons d’introduire dans les Processus Decisionnels de Markov Decentralises un mecanisme d’interaction directe inspire par des experiences ethologiques. Ce mecanisme d’interaction permet a deux agents d’effectuer des prises de decision collectives et d’introduire de ce fait des considerations plus globales dans le systeme. L’interet du formalisme est de pouvoir representer les actions et les interactions dans un cadre homogene. Nous presentons en outre un premier module d’interaction permettant un apprentissage simple a base de Q-learning des differents comportements collectifs (lors des prises de decision collectives) et individuels des entites mises en presence. Cet apprentissage utilise dans un probleme simple, fournit de premiers resultats encourageants et ouvrent des perspectives quant aux modules d’interaction qu’il pourrait etre interessant de considerer par la suite.},
}