Becker, J., Andre, V., & Dutech, A. (2019). QUALCOM : une expérience sur la qualification des comportements d’une lampe robotique. Techniques & culture, 19 P. https://hal.archives-ouvertes.fr/hal-02075467
Gay, S., Mille, A., Georgeon, O., & Dutech, A. (2016). Autonomous construction and exploitation of a spatial memory by a self-motivated agent. Cognitive Systems Research, 41, 1–35. https://doi.org/10.1016/j.cogsys.2016.07.004
Dutech, A., Scherrer, B., & Thiery, C. (2013). La carotte et le bâton... et Tetris. Images des Mathématiques. https://hal.inria.fr/hal-00922142
Dutech, A., Coutureau, E., & Marchand, A. (2011). A reinforcement learning approach to instrumental contingency degradation in rats. Journal of Physiology - Paris, 105(1-3), 36–44. https://doi.org/10.1016/j.jphysparis.2011.07.017
Aras, R., & Dutech, A. (2010). An investigation into Mathematical Programming for Finite Horizon Decentralized POMDPs. Journal of Artificial Intelligence Research, 37, 329–396. https://doi.org/10.1613/jair.2915
Buffet, O., Dutech, A., & Charpillet, F. (2007). Shaping Multi-Agent Systems with Gradient Reinforcement Learning. Autonomous Agents and Multi-Agent Systems, 15(2), 197–220. https://doi.org/10.1007/s10458-006-9010-5
Buffet, O., Dutech, A., & Charpillet, F. (2006). Etude de différentes combinaisons de comportements adaptatives. Revue des Sciences et Technologies de l’Information - Série RIA : Revue d’Intelligence Artificielle, 20(2-3), 311–344. https://hal.inria.fr/inria-00119272
Buffet, O., Dutech, A., & Charpillet, F. (2005). Développement autonome des comportements de base d’un agent. Revue des Sciences et Technologies de l’Information - Série RIA : Revue d’Intelligence Artificielle, 19(4-5), 603–632. https://hal.inria.fr/inria-00000572
Dutech, A., & Samuelides, M. (2003). Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés. Revue des Sciences et Technologies de l’Information - Série RIA : Revue d’Intelligence Artificielle, 17(4), 559–589. https://hal.inria.fr/inria-00099563
Calba, A., Dutech, A., & Fix, J. (2021). Density Independant Self-organized Support for Q-Value Function Interpolation in Reinforcement Learning. European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning (ESANN 2021), 6 P.
Zimmer, M., Boniface, Y., & Dutech, A. (2018). Developmental Reinforcement Learning through Sensorimotor Space Enlargement. ICDL-EPIROB 2018 - 8th joint IEEE International Conference on Development and Learning and on Epigenetic Robotics, 1–6. https://doi.org/10.1109/DEVLRN.2018.8761021
Granjon, P., Dutech, A., & Henaff, P. (2018). Guido and Am I Robot?, case study of two robotic artworks operating in public spaces. ICLI 2018 - International Conference on Live Interfaces, 133–150. https://hal.archives-ouvertes.fr/hal-01843041
Zimmer, M., Boniface, Y., & Dutech, A. (2016, July). Vers des architectures acteur-critique neuronales efficaces en données. Journées Francophones sur la Planification, la Décision et l’Apprentissage pour la conduite de systèmes. https://hal.archives-ouvertes.fr/hal-01344905
Zimmer, M., Boniface, Y., & Dutech, A. (2016, April). Neural Fitted Actor-Critic. ESANN 2016 - Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning. https://hal.archives-ouvertes.fr/hal-01350651
Fansi Tchango, A., Thomas, V., Buffet, O., Flacher, F., & Dutech, A. (2014, August). Simultaneous Tracking and Activity Recognition (STAR) using Advanced Agent-Based Behavioral Simulations. ECAI - Proceedings of the Twenty-first European Conference on Artificial Intelligence. https://hal.inria.fr/hal-01073424
Fansi Tchango, A., Thomas, V., Buffet, O., Flacher, F., & Dutech, A. (2014, August). Towards the Usage of Advanced Behavioral Simulations for Simultaneous Tracking and Activity Recognition. STAIRS 2014 - Proceedings of the Seventh European Starting AI Researcher Symposium. https://hal.inria.fr/hal-01073427
Fansi Tchango, A., Thomas, V., Buffet, O., Flacher, F., & Dutech, A. (2014, July). Tracking Multiple Interacting Targets Using a Joint Probabilistic Data Association Filter. FUSION 2014 - the 17th International Conference on Information Fusion. https://hal.inria.fr/hal-01073429
Fansi Tchango, A., Thomas, V., Buffet, O., Flacher, F., & Dutech, A. (2014, May). Simulation-Based Behavior Tracking of Pedestrians in Partially Observed Indoor Environments. AAMAS 2014 - the thirteenth international conference on autonomous agents and multiagent systems. https://hal.inria.fr/hal-01073434
Dutech, A. (2012). ”Réservoir computing” et Apprentissage par Renforcement Développemental. In O. Buffet (Ed.), Journées Francophones sur la planification, la décision et l’apprentissage pour le contrôle des systèmes - JFPDA 2012 (p. 13 p). https://hal.inria.fr/hal-00736316
Dutech, A. (2012). Self-organizing developmental reinforcement learning. International Conference on Simulated Animal Behavior. https://hal.inria.fr/hal-00705350
Sarzyniec, L., Buffet, O., & Dutech, A. (2011, May). Apprentissage par Renforcement Développemental en Robotique Autonome. Conférence d’Apprentissage - CAP 2011. https://hal.inria.fr/inria-00633426
Daucé, E., & Dutech, A. (2010). Cartes topographiques neuronales pour l’apprentissage par renforcement sur des problèmes de contrôle non-linéaire. 10e Colloque Africain sur la Recherche en Informatique et en Mathématiques Appliquées, 9 P. https://hal.inria.fr/inria-00494164
Daucé, E., & Dutech, A. (2010, October). Online Learning with Noise: A Kernel-Based Policy-Gradient Approach. Conférence Française de Neurosciences Computationnelles - NeuroComp 2010. https://hal.inria.fr/inria-00517006
Dutech, A., Coutureau, E., & Marchand, A. (2010, October). Reinforcement Learning Approaches to Instrumental Contingency Degradation in Rats. Conférence Française de Neurosciences Computationnelles - NeuroComp 2010. https://hal.inria.fr/inria-00517011
Aras, R., Dutech, A., & Charpillet, F. (2008). Mixed Integer Linear Programming For Exact Finite-Horizon Planning In Decentralized Pomdps. The International Conference on Automated Planning and Scheduling - ICAPS 2007, 18–25. https://hal.inria.fr/inria-00163372
Dutech, A. (2007). Modèles stochastiques de la prise de décision collective. Colloque de l’Association pour la Recherche Cognitive - ARCo’07 : Cognition – Complexité – Collectif, 167–176. https://hal.inria.fr/inria-00179596
Aras, R., Dutech, A., & Charpillet, F. (2007, July). Une méthode de programmation linéaire mixte pour les POMDP décentralisé à horizon fini. 2e Journées Francophones Planification, Décision, Apprentissage pour la conduite de systèmes - JFPDA 2007. https://hal.inria.fr/inria-00162469
Aras, R., Dutech, A., & Charpillet, F. (2006). Efficient Learning in Games. Conférence Francophone sur l’Apprentissage Automatique - CAP 2006. https://hal.inria.fr/inria-00102188
Dutech, A., Aras, R., & Charpillet, F. (2006). Apprentissage par Renforcement et Théorie des Jeux pour la coordination de Systèmes Multi-Agents. Colloque Africain sur la Recherche en Informatique - CARI 2006. https://hal.inria.fr/inria-00102192
Aras, R., Dutech, A., & Charpillet, F. (2005). Cooperation in stochastic games through communication. 4th International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS’05, 1197–1198. https://doi.org/10.1145/1082473.1082691
Aras, R., & Dutech, A. (2005, June). Apprentissage par renforcement et jeux stochastiques à information incomplète. Cinquièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA’05. https://hal.inria.fr/inria-00000212
Aras, R., Dutech, A., & Charpillet, F. (2004). Stigmergy in multi-agent reinforcement learning. Fourth International Conference on Hybrid Intelligent Systems - HIS’04, 468–469. https://doi.org/10.1109/ICHIS.2004.87
Aras, R., Dutech, A., & Charpillet, F. (2004, November). Cooperation through communication in decentralized Markov games. International Conference on Advances in Intelligent Systems - Theory and Applications - AISTA’2004. https://hal.inria.fr/inria-00000210
Buffet, O., Dutech, A., & Charpillet, F. (2004). Self-Growth of Basic Behaviors in an Action Selection Based Agent. In S. Schaal, A. J. Ijspeert, A. Billard, S. Vijayakumar, J. Hallam, & J.-A. Meyer (Eds.), Eighth International Conference on Simulation of Adaptive Behavior (SAB’04) (pp. 223–232). MIT Press. https://hal.inria.fr/inria-00000573
Dutech, A., Buffet, O., & Charpillet, F. (2004, June). Développement autonome des comportements de base d’un agent. Conférence d’Apprentissage (CAp’04). https://hal.inria.fr/inria-00000574
Rebeuf, X., Blanc, N., Charpillet, F., Chevé, D., Dutech, A., Lang, C., Pélissier, L., & Thomesse, J.-P. (2004). Proteus, des web services pour les systèmes de maintenance. In R. Dssouli (Ed.), Nouvelles Technologie de la Répartition - NOTERE’04 (pp. 163–178). Concordia University. https://hal.inria.fr/inria-00107792
Buffet, O., Dutech, A., & Charpillet, F. (2003). Automatic Generation of an Agent’s Basic Behaviors. In Rosenschein, Sandholm, Wooldridge, & Yokoo (Eds.), Second International Joint Conference on Autonomous Agents and Multi-Agent Systems - AAMAS’03 (pp. 875–882). ACM press. https://hal.inria.fr/inria-00099817
Dutech, A., Buffet, O., & Charpillet, F. (2003). Apprentissage par renforcement pour la conception de Systèmes Multi-Agents Réactifs. Journées Francophones sur les Systèmes Multi-Agents 2003 - JFSMA’03, 219–231. https://hal.inria.fr/inria-00099564
Buffet, O., Dutech, A., & Charpillet, F. (2002). Learning to weigh basic behaviors in Scalable Agents. First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 3, 1264–1265. https://hal.inria.fr/inria-00100765
Buffet, O., Dutech, A., & Charpillet, F. (2002). Adaptive Combination of Behaviors in an Agent. European Conference on Artificial Intelligence - ECAI’02, 48–52. https://hal.inria.fr/inria-00100766
Buffet, O., Charpillet, F., & Dutech, A. (2001). Incremental reinforcement learning for designing multi-agent systems. 5th International Conference on Autonomous Agents, 31–32. https://hal.inria.fr/inria-00100538
Dutech, A., Buffet, O., & Charpillet, F. (2001). Multi-Agent Systems by Incremental Gradient Reinforcement Learning. 17th International Joint Conference on Artificial Intelligence, 2, 833–838. https://hal.inria.fr/inria-00101090
Dutech, A. (2000). Solving POMDPs using selected past events. European Conference on Artificial Intelligence. https://hal.inria.fr/inria-00099378
Dutech, A., & Samuelides, M. (1996). World modeling by the fusion of simpler models. Proc. Of the Ics’96 International Conference on Artificial Intelligence.
Leerink, L., Jabri, M., & Dutech, A. (1992). Detection of word-boundaries from continuous phoneme streams using simple recurrent neural networs. Proceedings of the Fourth Australian International Conference on Speech Science and Technology.
Zimmer, M., Boniface, Y., & Dutech, A. (2016, December). Off-Policy Neural Fitted Actor-Critic. NIPS 2016 - Deep Reinforcement Learning Workshop. https://hal.archives-ouvertes.fr/hal-01413886
Zimmer, M., Boniface, Y., & Dutech, A. (2016, December). Toward a data efficient neural actor-critic. EWRL 2016 - The 13th European Workshop on Reinforcement Learning. https://hal.archives-ouvertes.fr/hal-01413885
Dutech, A. (2011). Dynamic reservoir for developmental reinforcement learning. In T. Kowaliw, N. Bredeche, & R. Doursat (Eds.), Workshop on Development and Learning in Artificial Neural Networks (DevLeaNN) (pp. 37–40). https://hal.inria.fr/inria-00633433
Aras, R., Dutech, A., & Charpillet, F. (2009). Quadratic Programming for Multi-Target Tracking. AAMAS Worshop : Multi-agent Sequential Decision-Making in Uncertain Domains, 4–10. https://hal.inria.fr/inria-00451638
Buffet, O., & Dutech, A. (2003). A Self-Made Agent Based on Action-Selection. Sixth European Workshop on Reinforcement Learning - EWRL-6 2003, 47–48. https://hal.inria.fr/inria-00099828
Dutech, A., & Scherrer, B. (2001). Learning to use contextual information for solving POMDP. European Workshop on Reinforcement Learning - EWRL-5, 2 p. https://hal.inria.fr/inria-00100539
Buffet, O., & Dutech, A. (2001). Looking for Scalable Agents. European Workshop on Reinforcement Learning, 2 p. https://hal.inria.fr/inria-00100537
Dutech, A., & Samuelides, M. (1999). Learning dynamical extensions of observation state in a partially observed environment. Workshop on Learning.
Collectif Psyphine (Ed.). (2021). Que prêtons-nous aux machines ? Approches interdisciplinaires des interactions homme-robot. PUN - Éditions Universitaires de Lorraine.
Bringay, S., Buffet, O., Dutech, A., Euzenat, J., Mattioli, J., Ranwez, S., Schwarzentruber, F., Thomas, V., Demazeau, Y., & Longin, D. (Eds.). (2018). Conférence Nationale d’Intelligence Artificielle Année 2018. Association Française pour l’Intelligence Artificielle (AFIA). https://hal.archives-ouvertes.fr/hal-02189744
Dutech, A. (2014). L’intelligence du geste robotique. In M. Guérin (Ed.), Le Geste entre émergence et apparence. Presses Universitaires de Provence (PUP). https://hal.inria.fr/hal-01260210
Legendre, M., Hollard, K., Buffet, O., & Dutech, A. (2012). MineSweeper: Where to Probe? (Research Report Nos. RR-8041; p. 26). INRIA. https://hal.inria.fr/hal-00723550
Zimmer, M., Boniface, Y., Dutech, A., & Rougier, N. P. (2012). Exploration de la notion de méta-apprentissage [Research Report]. Université de Lorraine, CNRS, Inria, LORIA, UMR 7503. https://hal.inria.fr/hal-02268027
Dutech, A. (2010). Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée) [Habilitation à diriger des recherches, Université Nancy II]. https://tel.archives-ouvertes.fr/tel-00549108 Matériel supplémentaire / Supplementary material : annexes (PDF) slides (PDF)
Daucé, E., & Dutech, A. (2010). Inverse Kinematics On-line Learning: a Kernel-Based Policy-Gradient approach. https://hal.inria.fr/inria-00520960
Dutech, A., & Scherrer, B. (2010). Partially Observable Markov Decision Processes. In O. Sigaud & O. Buffet (Eds.), Markov Decision Processes in Artificial Intelligence. ISTE Ltd and John Wiley & Sons Inc. https://hal.inria.fr/inria-00439123
Belgacem, S., Boniface, Y., & Dutech, A. (2009). Émergence et apprentissage d’information dans un modèle multimodal de cartes CNFT impulsionnelles. https://hal.archives-ouvertes.fr/hal-00802908
Aras, R., & Dutech, A. (2009). An investigation into Mathematical Programming for Finite Horizon Decentralized POMDPs (Research Report Nos. RR-7066). INRIA. https://hal.inria.fr/inria-00424394
Aras, R., Dutech, A., & Charpillet, F. (2008). Using linear programming duality for solving finite horizon Dec-POMDPs (Technical Report Nos. RR-6641; p. 27). INRIA. https://hal.inria.fr/inria-00320645
Dutech, A., & Scherrer, B. (2008). Processus décisionnels de Markov partiellement observables. In O. Sigaud & O. Buffet (Eds.), Processus décisionnels de Markov en intelligence artificielle: Vols. 1 - principes généraux et applications (pp. 89–133). Lavoisier - Hermes Science Publications. https://hal.inria.fr/inria-00335158 Matériel supplémentaire / Supplementary material : Extrait / extract (PDF)
Aras, R., Dutech, A., & Charpillet, F. (2006). Computing the Equilibria of Bimatrix Games using Dominance Heuristics. https://hal.archives-ouvertes.fr/hal-00118840
Dutech, A., & Buffet, O. (2003). Proceedings of the Sixth European Workshop on Reinforcement Learning. Sixth European Workshop on Reinforcement Learning - EWRL-6, 50 p. https://hal.inria.fr/inria-00099829
Buffet, O., Dutech, A., & Charpillet, F. (2003). Etude de différentes combinaisons de comportements adaptatives au sein d’un agent. (Intern Report A03-R-342 || buffet03d; p. 40 p). https://hal.inria.fr/inria-00099773
Dutech, A. (1999). Apprentissage d’environnements: Approches cognitives et comportementales [PhD thesis]. Ecole Nationale Supérieure de l’Aéronautique et de l’Espace, Toulouse, France.