Publications

Publications HAL de Vincent, Colotte

2024

Conference papers

titre
Synthèse de gestes communicatifs via STARGATE
auteur
Louis Abel, Vincent Colotte, Slim Ouni
article
Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole, Jul 2024, Toulouse, France. pp.181-190
Accès au bibtex
BibTex

2023

Conference papers

titre
Stochastic Pitch Prediction Improves the Diversity and Naturalness of Speech in Glow-TTS
auteur
Sewade Ogun, Vincent Colotte, Emmanuel Vincent
article
InterSpeech 2023, Aug 2023, Dublin, Ireland
Accès au texte intégral et bibtex
https://hal.univ-lorraine.fr/hal-04108825/file/Stochastic_Pitch_Prediction_for_Improving_the_Diversity_and_Naturalness_in_GlowTTS.pdf BibTex
titre
Can we use Common Voice to train a Multi-Speaker TTS system?
auteur
Sewade Ogun, Vincent Colotte, Emmanuel Vincent
article
The 2022 IEEE Spoken Language Technology Workshop (SLT 2022), Jan 2023, Doha, Qatar
Accès au texte intégral et bibtex
https://hal.science/hal-03812715/file/Can_we_use_Mozilla_Common_Voice_for_TTS_CC%20%281%29.pdf BibTex

2022

Conference papers

titre
Analysis of expressivity transfer in non-autoregressive end-to-end multispeaker TTS systems
auteur
Ajinkya Kulkarni, Vincent Colotte, Denis Jouvet
article
INTERSPEECH 2022, Sep 2022, Incheon, South Korea
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03832870/file/Interspeech_2022_expressivity_transfert.pdf BibTex
titre
Multi-stage attention for fine-grained expressivity transfer in multispeaker text-to-speech system
auteur
Ajinkya Kulkarni, Vincent Colotte, Denis Jouvet
article
EUSIPCO 2022, Aug 2022, Belgrade, Serbia
Accès au texte intégral et bibtex
https://hal.science/hal-03615773/file/EUSIPCO2022_Expressivity_transfert.pdf BibTex
titre
Synchronization of speech and gestures in an interactional context (SyncoGest Project)
auteur
Domitille Caillat, Ludovic Marin, Christelle Dodane, Fabrice Hirsch, Slim Ouni, Pierre Slangen, Patrice Guyot, Vincent Colotte, Aliyah Morgenstern, Louis Abel, Mickaëlla Grondin-Verdon, Juliette Lozano Goupil
article
ISGS 2022 – 9th Conference of the International Society for Gesture Studies, Jul 2022, Chicago, United States
Accès au bibtex
BibTex

2021

Journal articles

titre
Learning emotions latent representation with CVAE for Text-Driven Expressive AudioVisual Speech Synthesis
auteur
Sara Dahmani, Vincent Colotte, Valérian Girard, Slim Ouni
article
Neural Networks, 2021, 141, pp.315-329. ⟨10.1016/j.neunet.2021.04.021⟩
DOI
DOI : 10.1016/j.neunet.2021.04.021
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03204193/file/neural_networks_journal-8.pdf BibTex

Conference papers

titre
Improving transfer of expressivity for end-to-end multispeaker text-to-speech synthesis
auteur
Ajinkya Kulkarni, Vincent Colotte, Denis Jouvet
article
EUSIPCO 2021 – 29th European Signal Processing Conference, European Association for Signal Processing (EURASIP), Aug 2021, Dublin / Virtual, Ireland. ⟨10.23919/EUSIPCO54536.2021.9616249⟩
DOI
DOI : 10.23919/EUSIPCO54536.2021.9616249
Accès au texte intégral et bibtex
https://hal.science/hal-02978485/file/EUSIPCO_2021_camera_ready_version.pdf BibTex

2020

Journal articles

titre
Duration modelling and evaluation for Arabic statistical parametric speech synthesis
auteur
Imene Zangar, Zied Mnasri, Vincent Colotte, Denis Jouvet
article
Multimedia Tools and Applications, 2020, ⟨10.1007/s11042-020-09901-7⟩
DOI
DOI : 10.1007/s11042-020-09901-7
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03007287/file/Duration_Modelling_article_Sept_2020_Rev.pdf BibTex
titre
Some consideration on expressive audiovisual speech corpus acquisition using a multimodal platform
auteur
Sara Dahmani, Vincent Colotte, Slim Ouni
article
Language Resources and Evaluation, 2020, ⟨10.1007/s10579-020-09500-w⟩
DOI
DOI : 10.1007/s10579-020-09500-w
Accès au texte intégral et bibtex
https://hal.science/hal-02907046/file/LREV-4.pdf BibTex

Conference papers

titre
Transfer learning of the expressivity using flow metric learning in multispeaker text-to-speech synthesis
auteur
Ajinkya Kulkarni, Vincent Colotte, Denis Jouvet
article
INTERSPEECH 2020, Oct 2020, Shanghai / Virtual, China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02572106/file/interspeech_2020_published_version.pdf BibTex
titre
Deep variational metric learning for transfer of expressivity in multispeaker text to Speech
auteur
Ajinkya Kulkarni, Vincent Colotte, Denis Jouvet
article
SLSP 2020 – 8th International Conference on Statistical Language and Speech Processing, Oct 2020, Cardiff / Virtual, United Kingdom
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02573885/file/SLSP_2020_published_version.pdf BibTex
titre
Étude comparative des paramètres d’entrée pour la synthèse expressive audiovisuelle de la parole par DNNs
auteur
Sara Dahmani, Vincent Colotte, Slim Ouni
article
6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d’Études sur la Parole, Jun 2020, Nancy, France. pp.127-135
Accès au texte intégral et bibtex
https://hal.science/hal-02798526/file/46.pdf BibTex

Preprints, Working Papers, …

titre
Emotion recognition from phoneme-duration information
auteur
Ajinkya Kulkarni, Ioannis K Douros, Vincent Colotte, Denis Jouvet
article
2020
Accès au texte intégral et bibtex
https://hal.science/hal-02983229/file/ISSP_2020_submitted.pdf BibTex

2019

Conference papers

titre
Conditional Variational Auto-Encoder for Text-Driven Expressive AudioVisual Speech Synthesis
auteur
Sara Dahmani, Vincent Colotte, Valérian Girard, Slim Ouni
article
INTERSPEECH 2019 – 20th Annual Conference of the International Speech Communication Association, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02175776/file/interspeech19_sd_26_06.pdf BibTex
titre
Layer adaptation for transfer of expressivity in speech synthesis
auteur
Ajinkya Kulkarni, Vincent Colotte, Denis Jouvet
article
LTC’19 – 9th Language & Technology Conference, May 2019, Poznan, Poland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02177945/file/LTC19.pdf BibTex
titre
F0 modeling using DNN for Arabic parametric speech synthesis
auteur
Imene Zangar, Zied Mnasri, Vincent Colotte, Denis Jouvet
article
INNSBDDL 2019 – INNS Big Data and Deep Learning, Apr 2019, Sestri Levante, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02177496/file/conference_INNSBDDL2019.pdf BibTex

2018

Journal articles

titre
Evaluation of speech unit modelling for HMM-based speech synthesis for Arabic
auteur
Amal Houidhek, Vincent Colotte, Zied Mnasri, Denis Jouvet
article
International Journal of Speech Technology, 2018, pp.1-12. ⟨10.1007/s10772-018-09558-6⟩
DOI
DOI : 10.1007/s10772-018-09558-6
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01936963/file/IJST_Accepted_Version.pdf BibTex

Conference papers

titre
DNN-Based Speech Synthesis for Arabic: Modelling and Evaluation
auteur
Amal Houidhek, Vincent Colotte, Zied Mnasri, Denis Jouvet
article
SLSP 2018 – 6th International Conference on Statistical Language and Speech Processing, Oct 2018, Mons, Belgium
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01904512/file/slsp-final-depose-30-juillet-2018.pdf BibTex
titre
Duration modeling using DNN for Arabic speech synthesis
auteur
Imene Zangar, Zied Mnasri, Vincent Colotte, Denis Jouvet, Amal Houidhek
article
9th International Conference on Speech Prosody, Jun 2018, Poznań, Poland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01889917/file/SP18_paper_78_version_final.pdf BibTex

2017

Conference papers

titre
Statistical modelling of speech units in HMM-based speech synthesis for Arabic
auteur
Amal Houidhek, Vincent Colotte, Zied Mnasri, Denis Jouvet, Imene Zangar
article
LTC 2017 – 8th Language & Technology Conference, Nov 2017, Poznań, Poland. pp.1-5
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01649034/file/ltc-27-houidhek--final-version-27Oct2017.pdf BibTex
titre
On the quality of an expressive audiovisual corpus: a case study of acted speech
auteur
Slim Ouni, Sara Dahmani, Vincent Colotte
article
The 14th International Conference on Auditory-Visual Speech Processing, KTH, Aug 2017, Stockholm, Sweden
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01596614/file/AVSP2017_paper_22.pdf BibTex

2016

Conference papers

titre
Acoustic and Visual Analysis of Expressive Speech: A Case Study of French Acted Speech
auteur
Slim Ouni, Vincent Colotte, Sara Dahmani, Soumaya Azzi
article
Interspeech 2016, ISCA, Nov 2016, San Francisco, United States. pp.580 – 584, ⟨10.21437/Interspeech.2016-730⟩
DOI
DOI : 10.21437/Interspeech.2016-730
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01398528/file/expressive16.pdf BibTex
titre
The IFCASL Corpus of French and German Non-native and Native Read Speech
auteur
Jürgen Trouvain, Anne Bonneau, Vincent Colotte, Camille Fauth, Dominique Fohr, Denis Jouvet, Jeanin Jügler, Yves Laprie, Odile Mella, Bernd Möbius, Frank Zimmerer
article
LREC’2016, 10th edition of the Language Resources and Evaluation Conference, May 2016, Portorož, Slovenia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01293935/file/LREC_2016--251_Paper_2016.03.10.pdf BibTex

2015

Reports

titre
JCorpusRecorder
auteur
Vincent Colotte, Emilien Casano
article
[Technical Report] Université de Lorraine. 2015
Accès au bibtex
BibTex

2014

Journal articles

titre
Constitution d’un Corpus de Français Langue Etrangère destiné aux Apprenants Allemands
auteur
Camille Fauth, Anne Bonneau, Odile Mella, Vincent Colotte, Dominique Fohr, Denis Jouvet, Yves Laprie, Jürgen Trouvain
article
SHS Web of Conferences, 2014, 4e Congrès Mondial de Linguistique Française, 8, pp.14. ⟨10.1051/shsconf/20140801186⟩
DOI
DOI : 10.1051/shsconf/20140801186
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01080630/file/shsconf_cmlf14_01186.pdf BibTex

Conference papers

titre
Designing a Bilingual Speech Corpus for French and German Language Learners: a Two-Step Process
auteur
Camille Fauth, Anne Bonneau, Frank Zimmerer, Jürgen Trouvain, Bistra Andreeva, Vincent Colotte, Dominique Fohr, Denis Jouvet, Jeanin Jügler, Yves Laprie, Odile Mella, Bernd Möbius
article
LREC – 9th Language Resources and Evaluation Conference, The European Language Resources Association, May 2014, Reykjavik, Iceland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00979026/file/LREC_IFCASL_long.pdf BibTex

2013

Journal articles

titre
Acoustic-visual synthesis technique using bimodal unit-selection
auteur
Slim Ouni, Vincent Colotte, Utpala Musti, Asterios Toutios, Brigitte Wrobel-Dautcourt, Marie-Odile Berger, Caroline Lavecchia
article
EURASIP Journal on Audio, Speech, and Music Processing, 2013, 2013:16, ⟨10.1186/1687-4722-2013-16⟩
DOI
DOI : 10.1186/1687-4722-2013-16
Accès au bibtex
BibTex

Conference papers

titre
Automatic Feature Selection for Acoustic-Visual Concatenative Speech Synthesis: Towards a Perceptual Objective Measure
auteur
Utpala Musti, Vincent Colotte, Slim Ouni, Caroline Lavecchia, Brigitte Wrobel-Dautcourt, Marie-Odile Berger
article
AVSP – Audio Visual Speech Processing, Sep 2013, Annecy, France
Accès au bibtex
BibTex

Documents associated with scientific events

titre
Acoustic-visual synthesis technique using bimodal unit-selection
auteur
Slim Ouni, Vincent Colotte, Utpala Musti, Asterios Toutios, Brigitte Wrobel-Dautcourt, Marie-Odile Berger, Caroline Lavecchia
article
2013 (1), pp.16, 2013
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00841488/file/1687-4722-2013-16.pdf BibTex

2012

Journal articles

titre
Continuations intra- et interphrastiques du français : premiers résultats expérimentaux
auteur
Mathilde Dargnat, Vincent Colotte, Katarina Bartkova, Anne Bonneau
article
SHS Web of Conferences, 2012, 3e Congrès Mondial de Linguistique Française, 1, pp.1471-1485. ⟨10.1051/shsconf/20120100142⟩
DOI
DOI : 10.1051/shsconf/20120100142
Accès au bibtex
BibTex

Conference papers

titre
ViSAC : Acoustic-Visual Speech Synthesis: The system and its evaluation
auteur
Utpala Musti, Caroline Lavecchia, Vincent Colotte, Slim Ouni, Brigitte Wrobel-Dautcourt, Marie-Odile Berger
article
FAA: The ACM 3rd International Symposium on Facial Analysis and Animation, Sep 2012, Vienne, Austria
Accès au bibtex
BibTex
titre
Productions of « continuation contours » by French speakers in L1 (French) and L2 (English)
auteur
Katarina Bartkova, Anne Bonneau, Vincent Colotte, Mathilde Dargnat
article
Speech Prosody, May 2012, Shangai, China. pp.426-429
Accès au bibtex
BibTex
titre
Continuations intra et interphrastiques du français : premiers résultats expérimentaux
auteur
Mathilde Dargnat, Vincent Colotte, Katarina Bartkova, Anne Bonneau
article
CMLF 2012, 2012, Lyon, France. pp.1471-1485, ⟨10.1051/shsconf/20120100142⟩
DOI
DOI : 10.1051/shsconf/20120100142
Accès au texte intégral et bibtex
https://shs.hal.science/halshs-00958196/file/shsconf_cmlf12_000142.pdf BibTex

2011

Conference papers

titre
Intra- and Inter-clausal Continuation Slopes in French: First Results
auteur
Mathilde Dargnat, Anne Bonneau, Vincent Colotte, Katarina Bartkova
article
Experimental and Theoretical Advances in Prosody 2, Sep 2011, Montréal, Canada
Accès au bibtex
BibTex
titre
Non-conclusive » Slopes in French: First Results
auteur
Mathilde Dargnat, Anne Bonneau, Katarina Bartkova, Vincent Colotte
article
Interface Discours et prosodie 2011, University of Salford, Sep 2011, Manchester, United Kingdom
Accès au bibtex
BibTex
titre
Introducing Visual Target Cost within an Acoustic-Visual Unit-Selection Speech Synthesizer
auteur
Utpala Musti, Vincent Colotte, Asterios Toutios, Slim Ouni
article
International Conference on Auditory-Visual Speech Processing – AVSP2011, Aug 2011, Volterra, Italy
Accès au bibtex
BibTex
titre
Weight Optimization for Bimodal Unit-Selection Talking Head Synthesis
auteur
Asterios Toutios, Utpala Musti, Slim Ouni, Vincent Colotte
article
12thAnnual Conference of the International Speech Communication Association – Interspeech 2011, Aug 2011, Florence, Italy
Accès au bibtex
BibTex

Book sections

titre
Automatic Feedback for L2 Prosody Learning
auteur
Anne Bonneau, Vincent Colotte
article
Ivo Ipsic. Speech and Language Technologies, Intech, pp.55-70, 2011, 978-953-307-322-4
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00579255/file/Automatic-feedback-for-prosody-learning2.pdf BibTex

2010

Conference papers

titre
Towards a True Acoustic-Visual Speech Synthesis
auteur
Asterios Toutios, Utpala Musti, Slim Ouni, Vincent Colotte, Brigitte Wrobel-Dautcourt, Marie-Odile Berger
article
9th International Conference on Auditory-Visual Speech Processing – AVSP2010, Sep 2010, Hakone, Kanagawa, Japan. pp.POS1-8
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00526782/file/AVSP10-AT.pdf BibTex
titre
Setup for Acoustic-Visual Speech Synthesis by Concatenating Bimodal Units
auteur
Asterios Toutios, Utpala Musti, Slim Ouni, Vincent Colotte, Brigitte Wrobel-Dautcourt, Marie-Odile Berger
article
Interspeech 2010, ISCA, Sep 2010, Makuhari, Chiba, Japan. pp.486-489
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00526766/file/IS10-AT.pdf BibTex
titre
HMM-based Automatic Visual Speech Segmentation Using Facial Data
auteur
Utpala Musti, Asterios Toutios, Slim Ouni, Vincent Colotte, Brigitte Wrobel-Dautcourt, Marie-Odile Berger
article
Interspeech 2010, ISCA, Sep 2010, Makuhari, Chiba, Japan. pp.1401-1404
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00526776/file/IS10-UM.pdf BibTex

2008

Patents

titre
Method and device for speech synthesis
auteur
Vincent Colotte, Richard Beaufort
article
European Union, Patent n° : EP 1589524. 2008
Accès au bibtex
BibTex

2007

Conference papers

titre
Tools devoted to the acquisition of the prosody of a foreign language
auteur
Guillaume Henry, Anne Bonneau, Vincent Colotte
article
International Congress of Phonetic Sciences – ICPhS 2007, Aug 2007, Saarbrücken, Germany. pp.1593-1596
Accès au bibtex
BibTex

2006

Conference papers

titre
Making learners aware of the prosody of a foreign language
auteur
Guillaume Henry, Anne Bonneau, Vincent Colotte
article
Nov 2006, 5 p
Accès au bibtex
BibTex
titre
Détection et correction automatique des déviations dans la réalisation de l’accent lexical anglais par des apprenants français
auteur
Guillaume Henry, Anne Bonneau, Vincent Colotte
article
2006, pp.41–44
Accès au bibtex
BibTex

2005

Conference papers

titre
Linguistic features weighting for a Text-To-Speech system without prosody model
auteur
Vincent Colotte, Richard Beaufort
article
2005, pp.2549–2552
Accès au bibtex
BibTex

2004

Conference papers

titre
Compensation en milieu variant abruptement
auteur
Vincent Barreaud, Irina Illina, Dominique Fohr, Vincent Colotte
article
Journées d’Etudes sur la Parole – JEP’04, 2004, Fès, Maroc, 4 p
Accès au bibtex
BibTex
titre
Synthèse vocale par sélection linguistiquement orientée d’unités non-uniformes : LiONS
auteur
Vincent Colotte, Richard Beaufort
article
Journées d’Etudes sur la Parole – JEP’04, 2004, Fès, Maroc, 4 p
Accès au bibtex
BibTex
titre
A computer-assisted learning of English prosody for French students
auteur
Anne Bonneau, Matthieu Camus, Yves Laprie, Vincent Colotte
article
Integrating Speech in Learning (InSTIL 2004), 2004, Venise, Italie, 4 p
Accès au bibtex
BibTex

2002

Conference papers

titre
Modifying speech to improve the perception of L2
auteur
Vincent Colotte, Yves Laprie, Anne Bonneau
article
Integrating speech technology in learning – INSTIL 2002, Mar 2002, Davis, Ca, USA, 1 p
Accès au bibtex
BibTex
titre
Amélioration de la précision de la resynthèse avec TD-PSOLA
auteur
Vincent Colotte, Yves Laprie
article
XXIVème Journées d’Etude sur la Parole – JEP 2002, 2002, Nancy, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00107612/file/A02-R-398.pdf BibTex
titre
Higher precision pitch marking for TD-PSOLA
auteur
Vincent Colotte, Yves Laprie
article
XI European Signal Processing Conference- EUSIPCO 2002, 2002, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00107610/file/A02-R-397.pdf BibTex

Theses

titre
Techniques d’analyse et de synthèse de la parole appliquées à l’apprentissage des langues
auteur
Vincent Colotte
article
Autre [cs.OH]. Université Henri Poincaré – Nancy 1, 2002. Français. ⟨NNT : 2002NAN10222⟩
Accès au bibtex
BibTex

2001

Conference papers

titre
Perceptual experiments on enhanced and slowed down speech sentences for second language acquisition
auteur
Vincent Colotte, Yves Laprie, Anne Bonneau
article
European Conference on Speech Communication and Technology, 2001, Aalborg, Denmark, 4 p
Accès au bibtex
BibTex
titre
Signal transformation strategies to improve speech intelligibility for second language acquisition
auteur
Vincent Colotte, Yves Laprie, Anne Bonneau
article
17th International Congress on Acoustics, 2001, Rome, Italy, 2 p
Accès au bibtex
BibTex

2000

Conference papers

titre
Detecting relevant acoustic events for piloting improvement of intelligibility
auteur
Vincent Colotte, Yves Laprie
article
European Signal Processing Conference, 2000, Tampere, Finlande, 4 p
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00099033/file/A00-R-143.pdf BibTex
titre
Modification sélective du débit de parole
auteur
Vincent Colotte, Yves Laprie
article
Reconnaissance des Formes et Intelligence Artificielle – RFIA’2000, 2000, Paris, France, pp.141-148
Accès au bibtex
BibTex
titre
Amélioration automatique de l’intelligibilité de la parole
auteur
Vincent Colotte, Yves Laprie
article
Journées d’Etudes de la Parole, Institut de la Communication Parlée, 2000, Aussois, France, pp.105-108
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00099032/file/A00-R-142.pdf BibTex
titre
Towards phonetic tools for speech training
auteur
Anne Bonneau, Yves Laprie, Vincent Colotte
article
Integrating Speech Technology In (language) Learning – InSTIL2000, 2000, Dundee, Scotland, 4 p
Accès au bibtex
BibTex
titre
Automatic enhancement of speech intelligibility
auteur
Vincent Colotte, Yves Laprie
article
IEEE International Conference on Acoustics, Speech, & Signal Processing – ICASSP’2000, 2000, Istanbul, Turkey
Accès au bibtex
BibTex