Commencer par finir les TDs précédents.

Ensuite, vous pouvez récupérer les fichiers

Régression linéaire simple

Le fichier t1 contient des couples (x,y).

Le fichier TTL3 contient le résultat de la commande ping sur ~2000 machines, et donne pour chacun le TTL du paquet reçu, le temps (en ms) avant que le paquet soit reçu, et la provenance géographique du paquet.

On pense que le temps avant que le paquet soit reçu est linéaire en le nombre de routeurs traversés.

Régression linéaire multiple

On s'intéresse maintenant au fichier t2 qui contient des données du type (x,y,z), et on cherche une dépendance du type z = ax+by+c. La théorie est beaucoup plus compliquée que dans le cas d'une seule variable et on adopte donc une méthode approchée, dite méthode de descente du gradient stochastique.

L'idée est simple. On commence par fixe a,b,c arbitrairement (par exemple a=b=c=0) et un paramètre alpha = 0.01.

Pour chaque triplet (z,x,y) du fichier: