Projets Tutorés ASRALL 2014

Documents et liens

Soutenances

Rappels (cf slides):
Heuregroupejuryétudiants relecteurs
8h15A - Puppet (rapport)Jean, NussbaumClouet, Philippot, Boesch, Coulombet
9h10B - Selenium (rapport)Casset, MorelMougeot, Ameller, Bernard
10h05C - Mail (rapport)Morel, SarzyniecColardelle, Dräbing, Lehmann
11h00D - Ganeti (rapport)Sarzyniec, VaubourgRichier, Marchetti, Gauduchon, Gelly
pause
14h15E - DFS (rapport)Vaubourg, NussbaumGuyot, Papis, Cardona Ruiz, Dehlinger
15h10F - FAI (rapport)Casset, GoulinSchneider, Rodriguez Garcia, Laprevotte, Lutz
16h05G - OpenStack (rapport)Jean, GoulinReb, Fort, Bouajila, Hendel

Liste des sujets

Descriptif détaillé des sujets

A. Configuration automatique d'une infrastructure

Tuteur: Luc Sarzyniec <luc.sarzyniec chez inria.fr>

Etudiants: MOUGEOT, AMELLER, BERNARD

Mots-clés/résumé: Puppet; configuration automatique d'une infrastructure avec DHCP, DNS, MySQL, Kadeploy; utilisation des technologies de boot par le réseau; utilisation de Grid'5000 pour des tests à grande échelle

Titre: Installation d'une plateforme experimentale Kadeploy a l'aide
de puppet

Kadeploy [0] est un logiciel qui permet d'automatiser l'installation
d'un système d'exploitation sur des machines d'une grappe de
calculateurs (de plusieurs dizaines à plusieurs milliers de machines à
la fois).
Le logiciel est principalement utilisé sur la plateforme expérimentale
Grid'5000 [1].

Le fonctionnement de Kadeploy se base sur le de démarrage par le
réseau des machines (PXE, DHCP), ce qui rend le logiciel difficile à
tester sur un réseau de production (nécessité de pouvoir modifier la
configuration des serveur DHCP/TFTP lors des tests).
Le logiciel dépend aussi d'une pile logicielle assez conséquente,
entre autre: DNS, DHCP, TFTP, MySQL, HTTP, ... .

Installer une plateforme de test pour Kadeploy nécessite donc, dans un
premier temps, d'installer et de configurer tous ces services.

Un script a déjà été développé pour effectuer cette tache
d'installation sur des noeuds réservés au sein de la plateforme
Grid'5000 (offrant des outils d'isolation réseau).
Ce script sait générer les fichiers de configurations pour différentes
versions de Kadeploy et possède plusieurs modes de fonctionnement:
installation de l'infrastructure sur des machines physiques,
préparation d'une infrastructure de test à grande échelle se basant
sur des machines virtuelles, ... .

Les étudiants devront, dans un premier temps essayer de comprendre
Kadeploy et la pille logicielle dont il dépend puis remplacer le
script d'installation de la plateforme expérimentale par un ensemble
de recettes puppet [2].

Liens:
  [0] http://kadeploy3.gforge.inria.fr/
  [1] http://www.grid5000.fr/
  [2] http://puppetlabs.com/

B. Supervision d'applications Web

Tuteur: Mathieu Goulin <mathieu.goulin chez gadz.org>

Etudiants: COLARDELLE, DRÄBING, LEHMANN

Mots-clés/résumé: supervision avancée d'applications web en utilisant Selenium

Titre: Utilisation d'un outil de test logiciel pour faire de la supervision Opensource

Choisir et paramétrer un outil open source afin de réaliser la supervision
d'applications web (de type site internet, ...).

Proposition d'outil de test open source qui peuvent être testé :
Sahi
Selenium

L'idée est de mettre en place une architecture « preuve de concept » pour faire
la supervision d'application de type user-expérience. On défini un scenario
complexe, (connexion à l'application, recherche à travers formulaire, ...) et
le logiciel va effectuer ce scenario via un client navigateur web tel que
Firefox et vérifier que les pages s'affichent correctement.

Les étudiants devront :
Comprendre les enjeux de la supervision
Installer et apprendre à maitriser un outil de supervision open source
 tel que Nagios (ou éventuellement shinken).
Effectuer une étude comparative des solutions de test user-expériences
Paramétrer nagios pour qu'il utilise une des solutions issue de l'étude.

C. Infrastructure mail sécurisée

Tuteur: Stéphane Casset <sept chez logidee.com>

Etudiants: RICHIER, MARCHETTI, GAUDUCHON, GELLY

Mots-clés/résumé: infrastructure mail, PGP, cryptographie, sécurité

Garantir l'authenticité et l'intégrité des mails sortants via la
signature automatique de ceux-ci par PGP.
 o mettre en place une authorité de certification
 o mettre en place un serveur de mail (anti-spam, anti-virus)
 o mettre en place une infrastructure PGP permettant de signer automatiquement
les mails sortants
 o pour les mails signés entrant mettre en place une vérification automatique
des signatures et tagguer les mails de façon adaquate.
On peut continuer sur la mise en place d'une vraie infra PGP avec les clients
qui signent et/ou chiffrent le mails plus classiquement et finir sur une
comparaison des deux systèmes.

D. Infrastructure virtualisée avec Ganeti

Tuteur: Emile Morel <emile.morel chez inria.fr>

Etudiants: GUYOT, PAPIS, CARDONA RUIZ, DEHLINGER

Mots-clés/résumé: virtualisation KVM et Xen; gestion d'infrastructure virtuelle avec Ganeti; utilisation de Grid'5000 pour des tests à grande échelle

Titre: Étude de la migration d'une infrastructure de virtualisation XEN vers KVM
et ajout d'une couche ganeti.

Grid'5000 est une plateforme de recherche distribuée sur différents sites
(généralement au sein de laboratoires de recherche) et interconnecté par
l'intermédiaire de liens dédiés mis à disposition par RENATER. Chacun de ces
sites possèdent des services locaux (un vingtaine de MV généralement identiques
entre les sites) et des services globaux (VM de services unique mais
disponibles pour tous les sites).

La technologie de virtualisation utilisée pour les infrastructures est XEN mais
pour des raisons de performances mais aussi de simplicité d'administration,
l'équipe technique envisage de passer à la technologie KVM. Il sera donc
demandé dans un premier temps de définir les différentes contraintes d'un
passage d'une solution de virtualisation à l'autre et de proposer un workflow
complet en vue d'effectuer cette migration. Il sera demandé, dans un second
temps, d'étudier l'ajout de ganeti pour faciliter la migration à chaud de
services globaux entre différents sites.

E. Systèmes de fichiers distribués

Tuteur: Stéphane Casset <sept chez logidee.com>

Etudiants: SCHNEIDER, RODRIGUEZ GARCIA, LAPREVOTTE, LUTZ

Mots-clés/résumé: systèmes de fichiers distribués; Ceph; Lustre

Travail sur Ceph et Lustre (deux systèmes de fichiers distribués)
 o Installation du produit et documentation d'un HOWTO d'installation
 o Tests des fonctionnalités, voir si tout fonctionne correctement
 o Petits tests de performances pour comparer par rapport à ext4 par exemple
 o Tests des fonctionnalités de distributions :
   * accès multiples de clients
   * tests de redondance
   * test de réplication
   * test de tolérance aux pannes
 o Conclusion :
   * points forts/points faibles
   * maturité
   * solidité

F. Supervision et contrôle de la consommation réseau des abonnés d'un FAI

Tuteur: Sébastien Jean <sebastien.jean chez peccadilles.net>, avec Julien Vaubourg <julien.vaubourg chez inria.fr>

Etudiants: REB, FORT, BOUAJILA, HENDEL

Mots-clés/résumé: infrastructure réseau d'un fournisseur d'accès à internet (routage BGP, etc); monitoring; restriction du débit réseau avec QoS

Supervision et contrôle de la consommation réseau des abonnés d'un FAI.

L'objectif de ce projet est de concevoir une interface permettant
d'informer en temps réel les abonnés d'un FAI à propos de leur part de
consommation du réseau. Les étudiants devront trouver des solutions
pour calculer des débits différenciés à partir d'une interface réseau,
d'un vhost ou d'une boîte mail, pour les représenter sous forme de
graphiques (RRD). Ces derniers devront pouvoir être visualisés sur
plusieurs échelles de temps et indiquer le 95e centile (cf. Wikipédia)
correspondant à l'abonné. Le projet devra également être capable de
lever des alertes à partir de seuils et éventuellement de restreindre
le débit de l'interface / du vhost / du compte mail (QoS et configs).
Les débits pourront être distingués en fonction de la table de routage
de l'AS, pour séparer ce qui passe par le transit (payant) de ce qui
passe par des peers (gratuit). Ce sera l'occasion pour les étudiants
de comprendre le fonctionnement du routage entre AS, les contraintes
économiques qui s'appliquent et l'infrastructure d'un FAI associatif
qui héberge plusieurs AS (netns, bridges, vlans, BGP, etc). Le projet
nécessitera une étude importante aux niveaux réseau et système pour
trouver des solutions à des problématiques concrètes, du scripting et
un poil de web. Le sujet est extensible, avec par exemple des
objectifs en terme de détection et barrage des DDOS.

G. Infrastructure web élastique avec OpenStack

Tuteur: Lucas Nussbaum <lucas.nussbaum chez loria.fr>

Etudiants: CLOUET, PHILIPPOT, BOESCH, COULOMBET

Mots-clés/résumé: Cloud computing avec OpenStack; infrastructure Web; répartition de charge; utilisation de Grid'5000 pour des tests à grande échelle

OpenStack est une solution de Cloud. L'objectif de ce projet est de mettre
en place un Cloud privé OpenStack (donc d'installer et de configurer OpenStack)
et de l'utiliser pour y déployer une infrastructure web élastique (pouvant
automatiquement se déployer sur des machines supplémentaires en fonction de la
charge, probablement à l'aide d'HaProxy).

Les étudiants s'attacheront à évaluer l'intérêt des différents modules
d'OpenStack (Nova et Swift évidemment, mais aussi Cinder, Neutron, Horizon,
Keystone, Glance, Ceilometer, Heat ...).