Partie 5 - Threads

Support présentation

Introduction

Un thread (fil d’exécution), ou processus léger, est une unité d’exécution légère à l’intérieur d’un processus. Contrairement aux processus, les threads d’un même programme partagent la même mémoire (code, données, heap), mais disposent de leur propre stack (pile) et compteur ordinal (registre du processeur qui contient l’adresse mémoire de la prochaine instruction à exécuter).

  • Processus : unité lourde, isolée, avec espace mémoire séparé

  • Threads : unités légères, partagent la mémoire, plus rapides à créer et à communiquer

Avantages :

  • Partage facile de données (même mémoire)

  • Création et destruction plus rapides qu’un processus

  • Communication plus simple (pas besoin de mécanismes IPC lourds, voir chapitre IPC)

Inconvénients :

  • Risques de data race (accès concurrent non synchronisé)

  • Synchronisation nécessaire (mutex, sémaphores, …)

  • Un crash d’un thread peut faire planter tout le processus

Cas d’utilisation de threads :

  • Serveurs web multi-clients : chaque requête HTTP peut être gérée par un thread, avec partage du cache et des données globales.

  • Applications interactives : séparer l’interface utilisateur (UI) et le traitement lourd pour éviter le blocage (ex. un éditeur ou un jeu vidéo).

  • Calcul parallèle : diviser un gros calcul en plusieurs tâches parallèles sur des cœurs différents.

  • Producteur / consommateur : un thread lit des données (entrée clavier, socket réseau, fichier) pendant qu’un autre les traite.

  • Simulations : gestion de plusieurs entités indépendantes (ex. particules, joueurs dans un jeu en réseau).

Avec les systèmes Unix, nous disposons de deux types de threads :

  • les pthreads, pour POSIX thread, définis dans <pthread.h>, pour les systèmes Unix, que nous utiliserons dans ce cours

  • les threads, donnés par l’API C11, définis dans <threads.h>, plus portable

Dans les deux cas, le thread commence à s’exécuter à sa construction avec create. Il prend en entrée une variable qui contiendra le thread (utilisée principalement pour attendre celle-ci par la suite), un pointeur sur fonction et des arguments. Le thread principal pourra attendre la fin du thread avec join, s’il n’y a pas de join, au moment de la fin du programme, les threads seront tous interrompus. Le join permet aussi la libération des ressources du thread.

La signature du pointeur sur fonction des pthreads est void *(*__start_routine)(void *) soit une fonction __start_routine qui prend en entrée un void * et retourne un void *.

Les threads ne peuvent donc prendre en entrée qu’un seul argument de type void *, pour passer plusieurs arguments il faut donc passer par une structure.

Pour le type de retour, les pthreads retournent un pointeur sur n’importe quel type (void *), donc il faudra faire un malloc dans le thread avec les éléments à retourner.

POSIX threads

L’API standard sous Linux est Pthreads (POSIX threads), disponible avec l’en-tête <pthread.h> (voir man 7 pthreads). Pour la compilation, il ne faut pas oublier d’ajouter -pthread aux flags :

gcc -std=c2x -Wall -Wextra -pedantic -pthread mon_prog.c

La création se fait avec pthread_create :

int pthread_create(pthread_t *thread,
                   const pthread_attr_t *attr,
                   void *(*start_routine)(void *),
                   void *arg);
  • thread : pointeur où sera stocké l’identifiant du thread

  • attr : attributs du thread (souvent NULL)

  • start_routine : fonction exécutée par le thread

  • arg : argument passé à cette fonction

L’attente du thread se fait avec pthread_join :

int pthread_join(pthread_t thread, void **retval);
  • thread : l’identifiant du thread

  • retval : la valeur retournée par le thread (NULL si aucune valeur)

Le thread principal attendra la fin du thread au niveau de cette fonction tant que le thread n’aura pas terminé son calcul.

Si un pthread veut retourner une valeur, il peut utiliser pthread_exit à la fin de sa fonction :

void pthread_exit(void *retval);

Exemple sans retour de valeur :

 1 #define _GNU_SOURCE
 2 #include <pthread.h>
 3 #include <stdio.h>
 4 #include <stdlib.h>
 5 #include <unistd.h>
 6
 7 void *ma_fonction(void *arg) {
 8     int *val = (int *)arg;
 9     // gettid() donne le Thread ID
10     printf("Hello depuis le thread %d, arg = %d\n", gettid(), *val);
11     return NULL;
12 }
13
14 int main(void) {
15     pthread_t tid;
16     int valeur = 42;
17     // attention si la variable est locale à la fonction
18     // et que ce n'est pas la même fonction qui join le thread
19     // dans ce cas allouer la variable sur la heap
20
21     if (pthread_create(&tid, NULL, ma_fonction, &valeur) != 0) {
22         perror("pthread_create");
23         exit(EXIT_FAILURE);
24     }
25
26     // attendre la fin du thread
27     pthread_join(tid, NULL);
28
29     printf("Thread terminé !\n");
30     return EXIT_SUCCESS;
31 }

Exemple partiel avec une valeur retournée :

void *ma_fonction(void *arg) {
    int *res = malloc(sizeof(int));
    *res = 1234;
    pthread_exit(res);
    // ou
    // return res;
}

// main ...
int *resultat;
pthread_join(tid, (void **)&resultat);
printf("Résultat : %d\n", *resultat);
free(resultat);

Detached thread

Par défaut, un thread créé avec pthread_create est joinable, c’est-à-dire que le thread principal peut (et doit) appeler pthread_join dessus pour :

  • récupérer sa valeur de retour,

  • libérer les ressources associées au thread.

Si un thread joinable n’est jamais join, ses ressources ne sont jamais libérées, il créé une fuite mémoire interne (zombie thread).

Pour éviter cela, un thread peut être créé en mode détaché (detached). Un thread détaché :

  • libère automatiquement ses ressources lorsqu’il se termine,

  • ne peut plus être joint avec pthread_join,

  • est typiquement utilisé dans les serveurs (un thread par client).

Deux méthodes pour détacher un thread.

  1. Détacher après création : pthread_detach

pthread_t tid;
pthread_create(&tid, NULL, ma_fonction, NULL);

pthread_detach(tid); // le thread devient détaché

Ici, il est ensuite interdit d’appeler pthread_join(tid, ...).

  1. Créer directement un thread détaché

pthread_t tid;
pthread_attr_t attr;

pthread_attr_init(&attr);
pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);

pthread_create(&tid, &attr, ma_fonction, NULL);

pthread_attr_destroy(&attr);

Synchronisation

Comme plusieurs threads partagent les mêmes variables globales ou les données du tas (heap) grâce aux pointeurs, il faut éviter les accès concurrents non contrôlés. Sinon, on obtient des résultats incohérents : c’est le problème des race conditions (« conditions de compétition ») ou data race (course aux données, présenté ci-dessous).

Exemple classique : incrémenter une variable globale depuis deux threads.

 1#include <pthread.h>
 2#include <stdio.h>
 3
 4int compteur = 0;
 5
 6void *incremente(void *arg) {
 7    (void)arg;
 8    for (int i = 0; i < 1000000; i++) {
 9        compteur++;
10    }
11    return NULL;
12}
13
14int main(void) {
15    pthread_t t1, t2;
16    pthread_create(&t1, NULL, incremente, NULL);
17    pthread_create(&t2, NULL, incremente, NULL);
18
19    pthread_join(t1, NULL);
20    pthread_join(t2, NULL);
21
22    printf("Compteur final = %d\n", compteur);
23    return 0;
24}

Résultats observés (variables d’une exécution à l’autre) :

Compteur final = 1048495
Compteur final = 1102100
Compteur final = 1069216
Compteur final = 1087636

alors que le résultat attendu est 2 000 000 (chaque thread fait 1 000 000 incréments).

Pourquoi ce bug ?

L’opération compteur++ n’est pas atomique, elle se décompose en plusieurs instructions machine :

  1. Lire la valeur actuelle de compteur

  2. Ajouter 1

  3. Réécrire la nouvelle valeur dans compteur

Si deux threads exécutent cette séquence en même temps, ils peuvent interférer :

Exemple :

  • compteur = 50

  • Thread t1 lit 50

  • Thread t2 lit aussi 50 (presque en même temps)

  • t1 calcule 50+1 = 51 et écrit 51

  • t2 calcule 50+1 = 51 et écrit aussi 51

Résultat final, compteur = 51, alors qu’on aurait dû avoir compteur = 52.

Ce phénomène se produit des millions de fois dans la boucle, expliquant pourquoi le résultat final varie et est toujours inférieur à 2000000.

Solution : utiliser des mécanismes de synchronisation (mutex, opérations atomiques, etc.) pour rendre l’incrément atomique.

Mutex

Un mutex (mutual exclusion - verrou d’exclusion mutuelle) est un verrou qui garantit qu’un seul thread accède à une section critique à la fois.

Avec les pthreads, le mutex est un pthread_mutex_t qui peut être initialisé statiquement ou dynamiquement :

  • Initialisation statique : pthread_mutex_t m = PTHREAD_MUTEX_INITIALIZER;

  • Initialisation dynamique : pthread_mutex_init(&m, NULL);

  • Libération (si init dynamique) : pthread_mutex_destroy(&m);

Il peut ensuite être utilisé en le verrouillant avec pthread_mutex_lock avant la zone critique puis en le déverrouillant avec pthread_mutex_unlock après la zone critique. Si un thread essaie d’appeler pthread_mutex_lock sur un verrou déjà verrouillé, il est mis en attente jusqu’à ce que le mutex soit déverrouillé.

Exemple :

 1 #include <pthread.h>
 2 #include <stdio.h>
 3
 4 pthread_mutex_t verrou = PTHREAD_MUTEX_INITIALIZER;
 5 int compteur = 0;
 6
 7 void *incremente(void *arg) {
 8     (void)arg;
 9     for (int i = 0; i < 1000000; i++) {
10         pthread_mutex_lock(&verrou);
11         compteur++;
12         pthread_mutex_unlock(&verrou);
13     }
14     return NULL;
15 }
16
17 int main(void) {
18     pthread_t t1, t2;
19     pthread_create(&t1, NULL, incremente, NULL);
20     pthread_create(&t2, NULL, incremente, NULL);
21
22     pthread_join(t1, NULL);
23     pthread_join(t2, NULL);
24
25     printf("Compteur final = %d\n", compteur);
26     return 0;
27 }

Grâce au mutex, il n’y a plus de problèmes de data race (accès concurrent non synchronisé) et le compteur est bien à 2000000 en fin de calcul.

Il est aussi possible de mettre le mutex dans une structure qui accompagnera la donnée critique.

Atomic (C11)

Pour des compteurs simples, on peut simplifier la synchronisation en utilisant des opérations atomiques.

Une opération est dite atomique (dans le cadre de programmation concurrentielle) si toutes les étapes de l’opération s’exécutent sans pouvoir être interrompues avant leur fin.

La norme C11 introduit les opérations atomiques avec le header stdatomic.h qui apporte des types atomiques (atomic_int, atomic_bool, …) et un ensemble de fonctions pour travailler avec ces types.

Exemple avec un atomic_int :

#include <stdatomic.h>

atomic_int compteur = 0;

void *incremente(void *arg){
    for(int i=0;i<1000000;i++){
        atomic_fetch_add(&compteur, 1);
    }
    return NULL;
}

Avec cet atomic_int, nous somme sûrs que la lecture, la modification et l’écriture dans la variable compteur se fera sans être interrompue par un autre thread, et ce, sans avoir à utiliser de mutex.

Ces fonctions et types sont donc utiles pour travailler avec des petites variables, pour des plus gros blocs de code, il faudra utiliser des mutex.

Variables conditionnelles

Une variable conditionnelle avec Pthreads (pthread_cond_t) permet de faire attendre un thread jusqu’à ce qu’une condition devienne vraie.

Elle est toujours utilisée avec un mutex, et est essentielle pour les modèles :

  • producteur / consommateur

  • files de messages

  • tâches à réveil conditionnel

  • travail en lot (batch)

Fonctions principales :

  • pthread_cond_wait(cond, mutex) → met le thread en attente et libère le mutex atomiquement

  • pthread_cond_signal(cond) → réveille un thread en attente

  • pthread_cond_broadcast(cond) → réveille tous les threads en attente

Il faut toujours faire les wait dans une boucle dans le cas où plusieurs threads soient réveillés en même temps ou qu’un signal soit perdu.

Initialisation :

  • statique : pthread_cond_t cond = PTHREAD_COND_INITIALIZER;

  • dynamique : pthread_cond_init(&cond, NULL);

Exemple :

 1#include <pthread.h>
 2#include <stdbool.h>
 3#include <stdio.h>
 4#include <stdlib.h>
 5
 6int donnee = 0;
 7bool disponible = false;
 8
 9pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
10pthread_cond_t cond = PTHREAD_COND_INITIALIZER;
11
12void *producteur(void *arg) {
13    (void)arg;
14
15    // attend d'avoir la main pour modifier disponible
16    pthread_mutex_lock(&mutex);
17
18    donnee = 42;       // réalise son calcul
19    disponible = true; // passe disponible à vrai
20
21    // réveille le consommateur
22    pthread_cond_signal(&cond);
23
24    pthread_mutex_unlock(&mutex);
25    return NULL;
26}
27
28void *consommateur(void *arg) {
29    (void)arg;
30
31    // bloque le mutex pour être sûr que disponible ne soit pas modifié
32    pthread_mutex_lock(&mutex);
33
34    // attendre que disponible passe à true
35    while (!disponible) {
36        // attend la condition et relâche le mutex
37        pthread_cond_wait(&cond, &mutex);
38    }
39    disponible = false;
40
41    // une fois réveillé par le producteur
42    // la donnée est modifiée, il peut la lire
43    printf("Consommateur : donnée reçue = %d\n", donnee);
44
45    pthread_mutex_unlock(&mutex);
46    return NULL;
47}
48
49int main(void) {
50    pthread_t prod, cons;
51
52    pthread_create(&cons, NULL, consommateur, NULL);
53    pthread_create(&prod, NULL, producteur, NULL);
54
55    pthread_join(prod, NULL);
56    pthread_join(cons, NULL);
57
58    return 0;
59}