Tous mes cours sont disponibles sous licence CC BY-NC-SA (vous pouvez les utiliser et les modifier dans un but autre que commercial, mais il faut me citer et vous DEVEZ mettre votre création à disposition des autres, selon la même licence). En cas de lien cassé ou de problème, n’hésitez-pas à me contacter.
2023-2024
Licence
2022-2023
Licence 2
- Analyse de données textuelles (semestre 2, mardi 9h30 – 11h (amphi 122 Malsherves) et 11h – 12h30/12h30 – 14h (TD – salles BS17 et BS18)
- CM sur TXM avancé : import, spécificités / TD correspondant
- CM sur TXM : point / TD correspondant
Licence 3
- Bases de données (semestre 2, vendredi 8h30 – 10h (CM – salle 040 Serpente) et 10h – 12h (TD – salles D219/220/318 Serpente)
- Introduction
- Un peu de culture et d’histoire
- Principes des bases de données relationnelles
- Modélisation :
- Du modèle conceptuel au modèle logique et le TD à rendre
- Créer une BD (vidéo à suivre pour le TD)
- SQL
- Introduction à NoSQL
Master 1
- Grammaires formelles (semestre 1, vendredi 13h30 – 16h, D318)
- Présentations
- Définitions, questionnement, historique
- Langue et langages
- Rappels mathématiques et suites
- Bases
- Grammaires : règles de réécriture
- Structure et hiérarchie des grammaires formelles
- Expressions rationnelles (régulières) et introduction aux automates (et un automate par R. Queneau)
- Automates et transducteurs finis
- Grammaires régulières
- Grammaires hors-contexte
- Grammaires de type 1 et de type 0
- Forme normale de Chomsky
- Analyse syntaxique ascendante (CKY)
- Corpus, ressources et linguistique outillée (semestre 2, vendredi 13h30 – 16h, D318)
- Présentation(s)
- Corpus et droits
- Encodages et multilinguisme
- Introduction au TAL
- GREW-match :
- Universal dependencies et GREW-match
- GREW-match par script : requêtes multi-corpus (avec Python, directement ou via Jupyter notebook) – la doc et le notebook avec un exemple et le TD.
- Faire une présentation
- TXM :
- TXM : présentation et commandes de base
Regarder/naviguer dans les parties 1 et 2 des vidéos de B. Pincemin (en parallèle, c’est assez proche de mon cours). N’hésitez-pas à faire le tri en fonction de vos besoins et à ne regarder que ce dont vous avez besoin. - TXM : commandes avancées et import. Cours de B. Pincemin sur les Spécificités ici.
Regarder/naviguer dans la partie 3, à partir de « commande partition ». N’hésitez-pas à faire le tri en fonction de vos besoins et à ne regarder que ce dont vous avez besoin. - TD Mariage pour tous avec TXM (voir ci-dessus).
- TXM : présentation et commandes de base
- Unitex :
- Introduction à Unitex. Une Vidéo pour illustrer (attention, ne regarder que les 4 premières minutes).
- Unitex : expressions régulières. – Une petite vidéo maison pour vous montrer comment utiliser Unitex avec des expressions régulières (10 Mo, en mp4, plutôt sur Chrome).
- Unitex : graphes et grammaires locales – Une petite vidéo maison pour vous montrer comment créer un graphe sur Unitex et l’appliquer (15 Mo, en mp4, plutôt sur Chrome).
- Unitex : graphes et grammaires locales, un pas plus loin
Master 2
- Annotation collaborative de corpus (semestre 1, 8 séances à la suite, vendredi 8h30 – 11h, D318)
- Présentation(s)
- L’annotation manuelle de corpus en TAL (une transcription à faire et un article à lire)
- Formats et outils d’annotation
- Solutions au coût de l’annotation
- Evaluer l’annotation manuelle
- Crowdsourcing
- Jeux ayant un but et sciences participatives
- Dimensions de complexité
- Présentations des étudiants (15 min + questions)
Plateformes pour le TAL-> Ethique et TAL- Rappels et DIY
- Introduction aux plongements lexicaux — notebook pour le TD
- Biais dans les systèmes de TAL
- Ethique et TAL, au-delà des biais
2021-2022
Doctorat
- Intégrité scientifique (2x3h), Campus des Cordeliers — 18 et 25 novembre 2021
- Partie 1 : présentations et DIY (do it yourself)
- Partie 2 : manipulation de schémas, plagiat, reproductibilité (et vous)
Licence 3
- Bases de données (semestre 2, vendredi 8h30 – 10h (CM – salle 040 Serpente) et 10h – 12h (TD – salles D219/220/318 Serpente),
- Introduction
- Un peu de culture et d’histoire
- Principes des bases de données relationnelles
- Modélisation :
- modèle entités / associations
- cardinalités et formes normales
- correction, discussion
- Du modèle conceptuel au modèle logique et le TD à rendre
- Créer une BD (vidéo à suivre pour le TD)
- SQL
- Introduction à NoSQL (ex-Master architecture de l’information, ENS Lyon)
Master 1
- Grammaires formelles (semestre 1, vendredi 13h – 15h30, D318)
- Présentations
- Définitions, questionnement, historique
- Langue et langages
- Rappels mathématiques et suites
- Bases
- Grammaires : règles de réécriture
- Structure et hiérarchie des grammaires formelles
- Expressions rationnelles (régulières) et introduction aux automates (et un automate par R. Queneau)
- Automates et transducteurs finis
- Grammaires régulières
- Grammaires hors-contexte
- Grammaires de type 1 et de type 0
- Forme normale de Chomsky
- Analyse syntaxique ascendante (CKY)
- Corpus, ressources et linguistique outillée (semestre 2, vendredi 13h30 – 16h, D318)
- Présentation(s)
- Corpus et droits
- Encodages et multilinguisme
- Introduction au TAL
- GREW-match :
- Universal dependencies et GREW-match
- GREW-match par script : requêtes multi-corpus (avec Python, directement ou via Jupyter notebook) – la doc.
- Faire une présentation
- TXM :
- TXM : présentation et commandes de base
Regarder/naviguer dans les parties 1 et 2 des vidéos de B. Pincemin (en parallèle, c’est assez proche de mon cours). N’hésitez-pas à faire le tri en fonction de vos besoins et à ne regarder que ce dont vous avez besoin. - TXM : commandes avancées et import. Cours de B. Pincemin sur les Spécificités ici.
Regarder/naviguer dans la partie 3, à partir de « commande partition ». N’hésitez-pas à faire le tri en fonction de vos besoins et à ne regarder que ce dont vous avez besoin. - TD Mariage pour tous avec TXM (voir ci-dessus).
- TXM : présentation et commandes de base
- Unitex :
- Introduction à Unitex. Une Vidéo pour illustrer (attention, ne regarder que les 4 premières minutes).
- Unitex : expressions régulières. – Une petite vidéo maison pour vous montrer comment utiliser Unitex avec des expressions régulières (10 Mo, en mp4, plutôt sur Chrome).
- Unitex : graphes et grammaires locales – Une petite vidéo maison pour vous montrer comment créer un graphe sur Unitex et l’appliquer (15 Mo, en mp4, plutôt sur Chrome).
- Unitex : graphes et grammaires locales, un pas plus loin
- Interventions de Gaël de Chalendar (CEA / LIST) et Hugues de Mazancourt (Datapolitics.fr).
- Vos présentations sur : Open NLP, Core NLP, Spacy, gensim et LIMA.
Master 2
- Annotation collaborative de corpus (semestre 1, 8 séances à la suite, vendredi 8h30 – 11h, D318)
- Présentation(s)
- L’annotation manuelle de corpus en TAL (une transcription à faire et un article à lire)
- Formats et outils d’annotation
- Evaluer l’annotation manuelle
- Solutions au coût de l’annotation
- Crowdsourcing
- Jeux ayant un but et sciences participatives
- Dimensions de complexité
- Présentations des étudiants (15 min + questions)
- Plate-formes logicielles pour le TAL (semestre 1, 4 séances, vendredi 8h30 – 11h, D318)



