@INPROCEEDINGS{thomas04c, CRINNUMBER = {A04-R-110}, CATEGORY = {4}, EQUIPE = {MAIA}, AUTHOR = {Thomas, Vincent}, TITLE = {Interac-DEC-MDP \,: un premier formalisme pour l置tilisation d段nteractions directes dans un MDP decentralise}, BOOKTITLE = {{4{\`e}me Journ{\'e}e Processus de D{\'e}cision Markovien et Intelligence Artificielle - PDMIA 2004 et D{\'e}cision et Planification, Paris, france}}, YEAR ={ 2004}, MONTH ={ May}, KEYWORDS = {markov decision process, learning, multi-agent system, interaction}, ABSTRACT = {Nous proposons d段ntroduire dans les Processus Decisionnels de Markov Decentralises un mecanisme d段nteraction directe inspire par des experiences ethologiques. Ce mecanisme d段nteraction permet a deux agents d弾ffectuer des prises de decision collectives et d段ntroduire de ce fait des considerations plus globales dans le systeme. L段nteret du formalisme est de pouvoir representer les actions et les interactions dans un cadre homogene. Nous presentons en outre un premier module d段nteraction permettant un apprentissage simple a base de Q-learning des differents comportements collectifs (lors des prises de decision collectives) et individuels des entites mises en presence. Cet apprentissage utilise dans un probleme simple, fournit de premiers resultats encourageants et ouvrent des perspectives quant aux modules d段nteraction qu段l pourrait etre interessant de considerer par la suite.}, }