Commencer par finir les TDs précédents.
Ensuite, vous pouvez récupérer les fichiers
Le fichier t1
contient des couples (x,y).
Y ~ aX + b
. Calculer
également le coefficient de détermination. Conclusion ?
Le fichier TTL3
contient le résultat de la commande ping sur ~2000
machines, et donne pour chacun le TTL du paquet reçu, le temps (en ms)
avant que le paquet soit reçu, et la provenance géographique du paquet.
On pense que le temps avant que le paquet soit reçu est linéaire en le nombre de routeurs traversés.
T = aR + b
où T
est le temps et R le nombre de routeurs traversés. Calculer
également le coefficient de détermination. Conclusion ?
On s'intéresse maintenant au fichier t2
qui contient des données
du type (x,y,z), et on cherche une dépendance du type z = ax+by+c
.
La théorie est beaucoup plus compliquée que dans le cas d'une seule
variable et on adopte donc une méthode approchée, dite méthode de
descente du gradient stochastique.
L'idée est simple. On commence par fixe a,b,c arbitrairement (par exemple a=b=c=0) et un paramètre alpha = 0.01.
Pour chaque triplet (z,x,y) du fichier:
h = ax+by+c
e = z - h
e
: s'il est plus petit que -1, on le met à -1. S'il est plus grand que 1, on le met à 1.
a,b,c
avec la formule
a = a + x*e*alpha
b = b + y*e*alpha
c = c + 1*e*alpha