|
Éthique et Traitement Automatique des Langues
Journée d'étude de l' ATALA |
Objectifs - Conférenciers invités - Thèmes - Dates importantes - Articles acceptés - Programme de la journée - Comité scientifique - Accès
Informations pratiques
Entrée libre et gratuite !
Organisation : Karën Fort (STIH, Université Paris-sorbonne), Benoît Sagot (Alpage, INRIA/Paris 7)
Contact : karen.fort@paris-sorbonne.fr (en cas de problème : karen.fort@schplaf.org)
Date : samedi 22 novembre
Lieu : INALCO, Amphi 2, Paris
Conférenciers invités
La journée comprendra deux conférences invitées, l'une par Danièle Bourcier (CERSA CNRS), l'autre par JM Pierrel (ATILF CNRS).
- Danièle Bourcier : "Données textuelles et données personnelles : questions éthiques" →
- Jean-Marie Pierrel : "Questions éthiques liées aux ressources et plateformes de mutualisation de ressources informatisées" →
Dates importantes
- Date de la journée : 22 novembre 2014
- Date limite de soumission :
25 septembre 2014
- Date de notification aux auteurs :
27 octobre 2014 31 octobre 2014
Objectifs de la journée
Le TAL est une discipline au cœur de l'éthique scientifique, à la fois en tant qu'elle fournit des outils pour assurer l'utilisation éthique des données mais également par son long historique de travaux sur des sources sensibles, ou la nécessaire implication de nombreux collaborateurs pour la création de ressources langagières volumineuses.
Concernant les outils, l'anonymisation des données, qu'elles soient orales ou écrites, est un enjeu tant industriel qu'académique, avec des contraintes de couverture parfois fortes selon les besoins applicatifs ou de recherche, la nature des ressources et des informations à anonymiser ou encore les limitations légales. D'autres outils du TAL s'inscrivent également dans des préoccupations éthiques, comme les outils de détection de plagiat ou de vérification de faits.
La diversification des travaux sur corpus a par ailleurs amené la communauté à traiter des sources de plus de plus sensibles, qu'il s'agisse de données personnelles, médicales, voire à caractère criminel.
En outre, l'avènement du Web 2.0. et avec lui le développement de la myriadisation (crowdsourcing), pose de nouvelles questions quant à la manière de considérer les intervenants dans la création de ressources langagières.
Enfin, les préoccupations concernant l'utilisation des outils de TAL ne sont pas nouvelles, mais elles deviennent de plus en plus sensibles à l'heure des Big Data et du recoupement des données auquel participe le TAL. Aux questions juridico-économiques (fouille de brevets, droits associés aux données/logiciels), s'ajoutent les enjeux militaires (surveillance des échanges) et sociaux (le « droit à l’oubli » imposé à Google).
Cette journée d'étude se veut un lieu d'échange ouvert sur ces sujets.
Cet appel à communications s'adresse donc aux chercheur(e)s en traitement automatique des langues ou en linguistique, aux industriel(le)s ayant à utiliser des ressources langagières et aux expert(e)s dans les questions éthiques.
Thèmes de la journée
Les communications sollicitées concernent aussi bien des travaux de recherche que des expériences industrielles, notamment dans les domaines suivants :
- outils éthiques pour le TAL, ou reposant sur des techniques du TAL
- méthodes et bonnes pratiques éthiques en TAL
- TAL et aspects juridiques
- traitement des données sensibles
- recherche en TAL et principes éthiques
- myriadisation et éthique
Articles acceptés dans leur version finale (par ordre alphabétique de premier auteur)
- Analyse économique, juridique et éthique du crowdsourcing pour le TAL. G. Adda, J. Mariani, L. Besacier →
- L'impossibilité de l’anonymat dans le cadre de l’analyse du discours. M. Amblard, K. Fort, M. Musiol, M. Rebuschi →
- Pour une réflexion éthique sur les conséquences de l’usage des NTIC : le cas des aides
techniques (à composante langagière ou non) aux personnes handicapées. J-Y. Antoine, A. Lefeuvre →
- Traitement Automatique des Langues, Biens Communs Informationnels et Industries de la Langue. G. de Chalendar →
- Paralinguistique computationnelle pour la robotique affective : éthique et évaluation. L. Devillers
- Favorisons la diversité linguistique en TAL. C. Enguehard, M. Mangeot →
- Procédure d’anonymisation et traitement automatique : l’expérience d’ESLO. I. Eshkol-Taravella, L. Kanaan-Caillol, O. Baude, C. Dugua, D. Maurel →
- Ethique et construction collaborative de données lexicales par des GWAPs (quelques leçons tirées de l'expérience JeuxDeMots). M. Lafourcade, N. Le Brun →
- L'anonymisation, pierre d’achoppement pour le traitement automatique des courriels. H. de Mazancourt, A. Couillault, G. Recourcé →
Programme de la journée et présentations
-
9h30 -> 10h : introduction à la journée (K. Fort (STIH / Paris 4)) →
-
10h -> 11h : présentation invitée, D. Bourcier "Données textuelles et
données personnelles : questions éthiques" →
- 11h->11h15 : pause café-croissants
- 11h15->12h35 : Session Ethique du TAL (président de session : P. Paroubek (LIMSI CNRS))
-
Favorisons la diversité linguistique en TAL. C. Enguehard, M. Mangeot (ne souhaitent pas la diffusion de leur présentation)
- Pour une réflexion éthique sur les conséquences de l’usage des NTIC : le
cas des aides techniques (à composante langagière ou non) aux personnes
handicapées. J-Y. Antoine, A. Lefeuvre →
-
Traitement Automatique des Langues, Biens Communs Informationnels et
Industries de la Langue. G. de Chalendar →
-
Paralinguistique computationnelle pour la robotique affective : éthique
et évaluation. L. Devillers
- 14h->15h : présentation invitée, JM Pierrel "Questions éthiques liées
aux ressources et plateformes de mutualisation de ressources informatisées" →
-
15h->15h15 : pause café
- 15h15 -> 16h : Session Ressources langagières et éthique (présidente de session : I. Eshkol-Taravella (LLL / Université d’Orléans))
-
Analyse économique, juridique et éthique du crowdsourcing pour le TAL.
G. Adda, J. Mariani, L. Besacier (annulée)
-
Ethique et construction collaborative de données lexicales par des GWAPs
(quelques leçons tirées de l'expérience JeuxDeMots). M. Lafourcade, N.
Le Brun →
- 16h -> 17h : Session TAL pour l'éthique (présidente de session : A. Nazarenko (LIPN / Paris 13)
-
L'impossibilité de l’anonymat dans le cadre de l’analyse du discours. M.
Amblard, K. Fort, M. Musiol, M. Rebuschi →
-
Procédure d’anonymisation et traitement automatique : l’expérience
d’ESLO. I. Eshkol-Taravella, L. Kanaan-Caillol, O. Baude, C. Dugua, D.
Maurel →
-
L'anonymisation, pierre d’achoppement pour le traitement automatique des
courriels. H. de Mazancourt, A. Couillault, G. Recourcé →
- 17h : Discussion, conclusion de la journée
Comité scientifique
- Olivier Baude, LLL, Université d’Orléans
- Kevin B. Cohen, Biomedical Text Mining Group, University of Colorado School of Medicine
- Alain Couillault, L3i, Université de La Rochelle / Aproged
- Cécile Fabre, CLLE-ERSS, Université de Toulouse II
- Karën Fort, STIH, Université Paris-Sorbonne
- Cyril Grouin, LIMSI CNRS
- Joseph Mariani, IMMI / LIMSI CNRS
- Adeline Nazarenko, LIPN, Université Paris-Nord
- Isabelle Tellier, Université Sorbonne Nouvelle
Accès
INALCO, 65 Rue des Grands Moulins, Paris
métro Bibliothèque François Mitterrand
Amphi 2 (2e étage)