Publications d'Alain Dutech

[Revues]-[Conférences]-[Workshops]-[Ouvrages]-[Divers]

Revues [top]

Becker, J., Andre, V., & Dutech, A. (2019). QUALCOM : une expérience sur la qualification des comportements d’une lampe robotique. Techniques & culture, 19 P. https://hal.archives-ouvertes.fr/hal-02075467

Gay, S., Mille, A., Georgeon, O., & Dutech, A. (2016). Autonomous construction and exploitation of a spatial memory by a self-motivated agent. Cognitive Systems Research, 41, 1–35. https://doi.org/10.1016/j.cogsys.2016.07.004

Dutech, A., Scherrer, B., & Thiery, C. (2013). La carotte et le bâton... et Tetris. Images des Mathématiques. https://hal.inria.fr/hal-00922142

Dutech, A., Coutureau, E., & Marchand, A. (2011). A reinforcement learning approach to instrumental contingency degradation in rats. Journal of Physiology - Paris, 105(1-3), 36–44. https://doi.org/10.1016/j.jphysparis.2011.07.017

Aras, R., & Dutech, A. (2010). An investigation into Mathematical Programming for Finite Horizon Decentralized POMDPs. Journal of Artificial Intelligence Research, 37, 329–396. https://doi.org/10.1613/jair.2915

Buffet, O., Dutech, A., & Charpillet, F. (2007). Shaping Multi-Agent Systems with Gradient Reinforcement Learning. Autonomous Agents and Multi-Agent Systems, 15(2), 197–220. https://doi.org/10.1007/s10458-006-9010-5

Buffet, O., Dutech, A., & Charpillet, F. (2006). Etude de différentes combinaisons de comportements adaptatives. Revue des Sciences et Technologies de l’Information - Série RIA : Revue d’Intelligence Artificielle, 20(2-3), 311–344. https://hal.inria.fr/inria-00119272

Buffet, O., Dutech, A., & Charpillet, F. (2005). Développement autonome des comportements de base d’un agent. Revue des Sciences et Technologies de l’Information - Série RIA : Revue d’Intelligence Artificielle, 19(4-5), 603–632. https://hal.inria.fr/inria-00000572

Dutech, A., & Samuelides, M. (2003). Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés. Revue des Sciences et Technologies de l’Information - Série RIA : Revue d’Intelligence Artificielle, 17(4), 559–589. https://hal.inria.fr/inria-00099563

Conférence avec comité de lecture et actes [top]

Calba, A., Dutech, A., & Fix, J. (2021). Density Independant Self-organized Support for Q-Value Function Interpolation in Reinforcement Learning. European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning (ESANN 2021), 6 P.

Zimmer, M., Boniface, Y., & Dutech, A. (2018). Developmental Reinforcement Learning through Sensorimotor Space Enlargement. ICDL-EPIROB 2018 - 8th joint IEEE International Conference on Development and Learning and on Epigenetic Robotics, 1–6. https://doi.org/10.1109/DEVLRN.2018.8761021

Granjon, P., Dutech, A., & Henaff, P. (2018). Guido and Am I Robot?, case study of two robotic artworks operating in public spaces. ICLI 2018 - International Conference on Live Interfaces, 133–150. https://hal.archives-ouvertes.fr/hal-01843041

Zimmer, M., Boniface, Y., & Dutech, A. (2016, July). Vers des architectures acteur-critique neuronales efficaces en données. Journées Francophones sur la Planification, la Décision et l’Apprentissage pour la conduite de systèmes. https://hal.archives-ouvertes.fr/hal-01344905

Zimmer, M., Boniface, Y., & Dutech, A. (2016, April). Neural Fitted Actor-Critic. ESANN 2016 - Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning. https://hal.archives-ouvertes.fr/hal-01350651

Fansi Tchango, A., Thomas, V., Buffet, O., Flacher, F., & Dutech, A. (2014, August). Simultaneous Tracking and Activity Recognition (STAR) using Advanced Agent-Based Behavioral Simulations. ECAI - Proceedings of the Twenty-first European Conference on Artificial Intelligence. https://hal.inria.fr/hal-01073424

Fansi Tchango, A., Thomas, V., Buffet, O., Flacher, F., & Dutech, A. (2014, August). Towards the Usage of Advanced Behavioral Simulations for Simultaneous Tracking and Activity Recognition. STAIRS 2014 - Proceedings of the Seventh European Starting AI Researcher Symposium. https://hal.inria.fr/hal-01073427

Fansi Tchango, A., Thomas, V., Buffet, O., Flacher, F., & Dutech, A. (2014, July). Tracking Multiple Interacting Targets Using a Joint Probabilistic Data Association Filter. FUSION 2014 - the 17th International Conference on Information Fusion. https://hal.inria.fr/hal-01073429

Fansi Tchango, A., Thomas, V., Buffet, O., Flacher, F., & Dutech, A. (2014, May). Simulation-Based Behavior Tracking of Pedestrians in Partially Observed Indoor Environments. AAMAS 2014 - the thirteenth international conference on autonomous agents and multiagent systems. https://hal.inria.fr/hal-01073434

Dutech, A. (2012). ”Réservoir computing” et Apprentissage par Renforcement Développemental. In O. Buffet (Ed.), Journées Francophones sur la planification, la décision et l’apprentissage pour le contrôle des systèmes - JFPDA 2012 (p. 13 p). https://hal.inria.fr/hal-00736316

Dutech, A. (2012). Self-organizing developmental reinforcement learning. International Conference on Simulated Animal Behavior. https://hal.inria.fr/hal-00705350

Sarzyniec, L., Buffet, O., & Dutech, A. (2011, May). Apprentissage par Renforcement Développemental en Robotique Autonome. Conférence d’Apprentissage - CAP 2011. https://hal.inria.fr/inria-00633426

Daucé, E., & Dutech, A. (2010). Cartes topographiques neuronales pour l’apprentissage par renforcement sur des problèmes de contrôle non-linéaire. 10e Colloque Africain sur la Recherche en Informatique et en Mathématiques Appliquées, 9 P. https://hal.inria.fr/inria-00494164

Daucé, E., & Dutech, A. (2010, October). Online Learning with Noise: A Kernel-Based Policy-Gradient Approach. Conférence Française de Neurosciences Computationnelles - NeuroComp 2010. https://hal.inria.fr/inria-00517006

Dutech, A., Coutureau, E., & Marchand, A. (2010, October). Reinforcement Learning Approaches to Instrumental Contingency Degradation in Rats. Conférence Française de Neurosciences Computationnelles - NeuroComp 2010. https://hal.inria.fr/inria-00517011

Aras, R., Dutech, A., & Charpillet, F. (2008). Mixed Integer Linear Programming For Exact Finite-Horizon Planning In Decentralized Pomdps. The International Conference on Automated Planning and Scheduling - ICAPS 2007, 18–25. https://hal.inria.fr/inria-00163372

Dutech, A. (2007). Modèles stochastiques de la prise de décision collective. Colloque de l’Association pour la Recherche Cognitive - ARCo’07 : Cognition – Complexité – Collectif, 167–176. https://hal.inria.fr/inria-00179596

Aras, R., Dutech, A., & Charpillet, F. (2007, July). Une méthode de programmation linéaire mixte pour les POMDP décentralisé à horizon fini. 2e Journées Francophones Planification, Décision, Apprentissage pour la conduite de systèmes - JFPDA 2007. https://hal.inria.fr/inria-00162469

Aras, R., Dutech, A., & Charpillet, F. (2006). Efficient Learning in Games. Conférence Francophone sur l’Apprentissage Automatique - CAP 2006. https://hal.inria.fr/inria-00102188

Dutech, A., Aras, R., & Charpillet, F. (2006). Apprentissage par Renforcement et Théorie des Jeux pour la coordination de Systèmes Multi-Agents. Colloque Africain sur la Recherche en Informatique - CARI 2006. https://hal.inria.fr/inria-00102192

Aras, R., Dutech, A., & Charpillet, F. (2005). Cooperation in stochastic games through communication. 4th International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS’05, 1197–1198. https://doi.org/10.1145/1082473.1082691

Aras, R., & Dutech, A. (2005, June). Apprentissage par renforcement et jeux stochastiques à information incomplète. Cinquièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA’05. https://hal.inria.fr/inria-00000212

Aras, R., Dutech, A., & Charpillet, F. (2004). Stigmergy in multi-agent reinforcement learning. Fourth International Conference on Hybrid Intelligent Systems - HIS’04, 468–469. https://doi.org/10.1109/ICHIS.2004.87

Aras, R., Dutech, A., & Charpillet, F. (2004, November). Cooperation through communication in decentralized Markov games. International Conference on Advances in Intelligent Systems - Theory and Applications - AISTA’2004. https://hal.inria.fr/inria-00000210

Buffet, O., Dutech, A., & Charpillet, F. (2004). Self-Growth of Basic Behaviors in an Action Selection Based Agent. In S. Schaal, A. J. Ijspeert, A. Billard, S. Vijayakumar, J. Hallam, & J.-A. Meyer (Eds.), Eighth International Conference on Simulation of Adaptive Behavior (SAB’04) (pp. 223–232). MIT Press. https://hal.inria.fr/inria-00000573

Dutech, A., Buffet, O., & Charpillet, F. (2004, June). Développement autonome des comportements de base d’un agent. Conférence d’Apprentissage (CAp’04). https://hal.inria.fr/inria-00000574

Rebeuf, X., Blanc, N., Charpillet, F., Chevé, D., Dutech, A., Lang, C., Pélissier, L., & Thomesse, J.-P. (2004). Proteus, des web services pour les systèmes de maintenance. In R. Dssouli (Ed.), Nouvelles Technologie de la Répartition - NOTERE’04 (pp. 163–178). Concordia University. https://hal.inria.fr/inria-00107792

Buffet, O., Dutech, A., & Charpillet, F. (2003). Automatic Generation of an Agent’s Basic Behaviors. In Rosenschein, Sandholm, Wooldridge, & Yokoo (Eds.), Second International Joint Conference on Autonomous Agents and Multi-Agent Systems - AAMAS’03 (pp. 875–882). ACM press. https://hal.inria.fr/inria-00099817

Dutech, A., Buffet, O., & Charpillet, F. (2003). Apprentissage par renforcement pour la conception de Systèmes Multi-Agents Réactifs. Journées Francophones sur les Systèmes Multi-Agents 2003 - JFSMA’03, 219–231. https://hal.inria.fr/inria-00099564

Buffet, O., Dutech, A., & Charpillet, F. (2002). Learning to weigh basic behaviors in Scalable Agents. First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 3, 1264–1265. https://hal.inria.fr/inria-00100765

Buffet, O., Dutech, A., & Charpillet, F. (2002). Adaptive Combination of Behaviors in an Agent. European Conference on Artificial Intelligence - ECAI’02, 48–52. https://hal.inria.fr/inria-00100766

Buffet, O., Charpillet, F., & Dutech, A. (2001). Incremental reinforcement learning for designing multi-agent systems. 5th International Conference on Autonomous Agents, 31–32. https://hal.inria.fr/inria-00100538

Dutech, A., Buffet, O., & Charpillet, F. (2001). Multi-Agent Systems by Incremental Gradient Reinforcement Learning. 17th International Joint Conference on Artificial Intelligence, 2, 833–838. https://hal.inria.fr/inria-00101090

Dutech, A. (2000). Solving POMDPs using selected past events. European Conference on Artificial Intelligence. https://hal.inria.fr/inria-00099378

Dutech, A., & Samuelides, M. (1996). World modeling by the fusion of simpler models. Proc. Of the Ics’96 International Conference on Artificial Intelligence.

Leerink, L., Jabri, M., & Dutech, A. (1992). Detection of word-boundaries from continuous phoneme streams using simple recurrent neural networs. Proceedings of the Fourth Australian International Conference on Speech Science and Technology.

Workshops avec comité de lecture avec ou sans actes [top]

Zimmer, M., Boniface, Y., & Dutech, A. (2016, December). Off-Policy Neural Fitted Actor-Critic. NIPS 2016 - Deep Reinforcement Learning Workshop. https://hal.archives-ouvertes.fr/hal-01413886

Zimmer, M., Boniface, Y., & Dutech, A. (2016, December). Toward a data efficient neural actor-critic. EWRL 2016 - The 13th European Workshop on Reinforcement Learning. https://hal.archives-ouvertes.fr/hal-01413885

Dutech, A. (2011). Dynamic reservoir for developmental reinforcement learning. In T. Kowaliw, N. Bredeche, & R. Doursat (Eds.), Workshop on Development and Learning in Artificial Neural Networks (DevLeaNN) (pp. 37–40). https://hal.inria.fr/inria-00633433

Aras, R., Dutech, A., & Charpillet, F. (2009). Quadratic Programming for Multi-Target Tracking. AAMAS Worshop : Multi-agent Sequential Decision-Making in Uncertain Domains, 4–10. https://hal.inria.fr/inria-00451638

Buffet, O., & Dutech, A. (2003). A Self-Made Agent Based on Action-Selection. Sixth European Workshop on Reinforcement Learning - EWRL-6 2003, 47–48. https://hal.inria.fr/inria-00099828

Dutech, A., & Scherrer, B. (2001). Learning to use contextual information for solving POMDP. European Workshop on Reinforcement Learning - EWRL-5, 2 p. https://hal.inria.fr/inria-00100539

Buffet, O., & Dutech, A. (2001). Looking for Scalable Agents. European Workshop on Reinforcement Learning, 2 p. https://hal.inria.fr/inria-00100537

Dutech, A., & Samuelides, M. (1999). Learning dynamical extensions of observation state in a partially observed environment. Workshop on Learning.

Thèse, Rapport scientifiques, Chap. Livre [top]

Collectif Psyphine (Ed.). (2021). Que prêtons-nous aux machines ? Approches interdisciplinaires des interactions homme-robot. PUN - Éditions Universitaires de Lorraine.

Bringay, S., Buffet, O., Dutech, A., Euzenat, J., Mattioli, J., Ranwez, S., Schwarzentruber, F., Thomas, V., Demazeau, Y., & Longin, D. (Eds.). (2018). Conférence Nationale d’Intelligence Artificielle Année 2018. Association Française pour l’Intelligence Artificielle (AFIA). https://hal.archives-ouvertes.fr/hal-02189744

Dutech, A. (2014). L’intelligence du geste robotique. In M. Guérin (Ed.), Le Geste entre émergence et apparence. Presses Universitaires de Provence (PUP). https://hal.inria.fr/hal-01260210

Legendre, M., Hollard, K., Buffet, O., & Dutech, A. (2012). MineSweeper: Where to Probe? (Research Report Nos. RR-8041; p. 26). INRIA. https://hal.inria.fr/hal-00723550

Zimmer, M., Boniface, Y., Dutech, A., & Rougier, N. P. (2012). Exploration de la notion de méta-apprentissage [Research Report]. Université de Lorraine, CNRS, Inria, LORIA, UMR 7503. https://hal.inria.fr/hal-02268027

Dutech, A. (2010). Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée) [Habilitation à diriger des recherches, Université Nancy II]. https://tel.archives-ouvertes.fr/tel-00549108 Matériel supplémentaire / Supplementary material : annexes (PDF) slides (PDF)

Daucé, E., & Dutech, A. (2010). Inverse Kinematics On-line Learning: a Kernel-Based Policy-Gradient approach. https://hal.inria.fr/inria-00520960

Dutech, A., & Scherrer, B. (2010). Partially Observable Markov Decision Processes. In O. Sigaud & O. Buffet (Eds.), Markov Decision Processes in Artificial Intelligence. ISTE Ltd and John Wiley & Sons Inc. https://hal.inria.fr/inria-00439123

Belgacem, S., Boniface, Y., & Dutech, A. (2009). Émergence et apprentissage d’information dans un modèle multimodal de cartes CNFT impulsionnelles. https://hal.archives-ouvertes.fr/hal-00802908

Aras, R., & Dutech, A. (2009). An investigation into Mathematical Programming for Finite Horizon Decentralized POMDPs (Research Report Nos. RR-7066). INRIA. https://hal.inria.fr/inria-00424394

Aras, R., Dutech, A., & Charpillet, F. (2008). Using linear programming duality for solving finite horizon Dec-POMDPs (Technical Report Nos. RR-6641; p. 27). INRIA. https://hal.inria.fr/inria-00320645

Dutech, A., & Scherrer, B. (2008). Processus décisionnels de Markov partiellement observables. In O. Sigaud & O. Buffet (Eds.), Processus décisionnels de Markov en intelligence artificielle: Vols. 1 - principes généraux et applications (pp. 89–133). Lavoisier - Hermes Science Publications. https://hal.inria.fr/inria-00335158 Matériel supplémentaire / Supplementary material : Extrait / extract (PDF)

Aras, R., Dutech, A., & Charpillet, F. (2006). Computing the Equilibria of Bimatrix Games using Dominance Heuristics. https://hal.archives-ouvertes.fr/hal-00118840

Dutech, A., & Buffet, O. (2003). Proceedings of the Sixth European Workshop on Reinforcement Learning. Sixth European Workshop on Reinforcement Learning - EWRL-6, 50 p. https://hal.inria.fr/inria-00099829

Buffet, O., Dutech, A., & Charpillet, F. (2003). Etude de différentes combinaisons de comportements adaptatives au sein d’un agent. (Intern Report A03-R-342 || buffet03d; p. 40 p). https://hal.inria.fr/inria-00099773

Dutech, A. (1999). Apprentissage d’environnements: Approches cognitives et comportementales [PhD thesis]. Ecole Nationale Supérieure de l’Aéronautique et de l’Espace, Toulouse, France.

Communications diverses [top]

Apprentissage par Renforcement Dévelopemental. Matthieu Zimmer, Yann Boniface, Alain Dutech. PFIA2018 : Journée IA & Robotique, Nancy, juillet 2018.
Télécharger / Download : PDF
Processus Décisionnels de Markov (Partiellement Observables). Alain Dutech. Journées CMC, IECL, juillet 2014.
Télécharger / Download : PDF
Méta-heuristiques pour l'optimisation : Differential Evolution et Particle Swarm Optimisation. Alain Dutech. Séminaire MAIA, LORIA, mai 2010.
Télécharger / Download : PDF, Python code example
IA et Cognition Incarnée. Alain Dutech. Conférence au Lycée Jeanne d'Arc, Remiremont, mars 2010.
Télécharger / Download : PDF
Tutorial sur les POMDP. Alain Dutech. Séminaire de l'équipe TAO, Orsay, janvier 2010.
Télécharger / Download : PDF
Tutorial sur les POMDP. Alain Dutech. Atelier sur les MDP, RFIA'2010, Caen, France, janvier 2010.
Télécharger / Download : PDF
Apprentissage par Renforcement (Efficace). Alain Dutech. Exposé dans le cadre du séminaire MIS du 11/07/2008, Loria, Nancy, juillet 2007.
Télécharger / Download : PDF
Intelligence Artificielle : espèce en voie d'apparition?. Alain Dutech et Nazim Fatès. Conférence dans le cadre de la fête de la science à Saint-Dizier, Saint-Dizier, octobre 2007.
Télécharger / Download : PDF
Self-Growing of Basic Behaviors by an Agent using Reinforcement Learning. Olivier Buffet, François Charpillet et Alain Dutech. MAIA-UMASS Workshop, Nancy, juin 2004.
Télécharger / Download :
Résoudre les POMDP en utilisant des informations contextuelles. Alain Dutech. Journées "Stochastiques", Université Laval, Québec, Canada, 3 et 4 mars 2003.
Télécharger / Download :
Modèles Stochastiques pour la Décision. Alain Dutech. Journées du Réseau CogniEST, Traitement numériques issus de la Biologie, Metz, 23 et 24 mars 2002.
Télécharger / Download :
Coopération par Apprentissage dans les systèmes artificiels. Alain Dutech. Assemblée Générale du Réseau CogniEST, La petite Pierre, 18 octobre 2001.
Télécharger / Download :
Reinforcement Learning for the design of multi-agent systems. Alain Dutech, Olivier Buffet. Séminaire LORIA-NASA, Robotique Mobile sur Mars, novembre 2000.
Télécharger / Download :
Apprendre à s'adapter dans les modèles de Markov. Alain Dutech. Actes de la Journée sur l'Adaptation, INRA Champenoux, mai 2000.
Télécharger / Download :

Dernière mise à jour par Alain le 23 septembre 2021