Commencer par finir le TP1.
Voici les fichiers pour cet exercice et le suivant. Ils utilisent tous deux des données réelles. Pour lire les différents fichiers de données, utiliser un code semblable à celui fourni au TP1.
Vous trouverez dans le fichier TTL
une liste de TTL correspondant
à l'exécution de la commande ping vers un millier de serveurs.
Typiquement, le TTL commence à une valeur qui vaut 255 (Cisco), 128
(Windows) ou 64 (Linux) et décroit à chaque fois qu'il traverse un
routeur. On admet que les paquets du fichier TTL
n'ont jamais passé plus de 60
routeurs.
n
entre 0 et 60
le nombre de paquets qui ont traversé exactement n
routeurs et
afficher le résultat avec gnuplot. Vérifier que ca ressemble (un peu)
à une gaussienne.
On cherche à estimer le nombre d'albums différents que propose un site spécialisé dans la critique d'albums. Il se trouve que tous les albums sur le site sont numérotés, on va utiliser cette information pour estimer ce nombre.
random
. En utilisant ce bouton 1000
fois, on obtient le fichier album-random
. Estimer le nombre
d'albums contenu dans le site
Cette première approche est inadaptée. En effet, de nombreux numéros correspondaient à des albums en double et ont été supprimés.
top-10000
. Chercher combien il y a
d'albums en commun entre les fichiers top-10000
et
album-random
et en déduire une estimation du nombre total
d'albums.
(Bien réfléchir à comment calculer le nombre d'albums en commun,
pour avoir un algorithme suffisament rapide)
(Note: L'estimation par la deuxième méthode est très proche de la réalité, la troisème approche surestime la population)