Aller au contenu

Service Jupyterhub

Ce service est expérimental et évoluera au cours des prochains mois.

Le service Jupyterhub est un portail web permettant un usage interactif d'une partie des nœuds de calcul du cluster Austral via l'exécution de serveurs jupyterlab sur le supercalculateur.

Orienté Intelligence Artificielle et traitement des données, les principaux objectifs de ce service sont :

  1. le paramétrage des modèles d'IA afin de préparer de longs entraînements avant leur soumission en mode batch
  2. le monitoring des travaux d'entraînement de modèle ou de traitement de données à l'aide d'interfaces telles que tensorboard ou Dask dashboard

Définitions et workflow

Jupyterlab est un environnement de programmation interactif basé sur une interface web. Son mode de fonctionnement est l'exécution d'un service jupyterlab sur un serveur et la connexion à ce serveur via un navigateur web.

Jupyterhub est un portail multi-utilisateurs permettant de gérer plusieurs instances de jupyterlab chacune associée à un utilisateur.

Sur Austral, le workflow pour l'utilisation de Jupyter est le suivant :

  1. se connecter au portail Jupyterhub
  2. demander l'exécution temporaire d'un service jupyterlab sur des ressources de calcul d'Austral.

Restrictions

  • Un seul service jupyterlab en simultanée par login
  • Seule une partie des ressources du calculateur est accessible (partitions tcourt_intra, hpda et hpda_mig)
  • Durée de vie d'un service jupyterlab limitée à 8h

Connexion au portail Jupyterhub et lancement d'un serveur jupyterlab

La connexion au portail se fait à partir d'un navigateur web à l'adresse : https://austral-hub.criann.fr en cliquant sur Sign in with Austral OpenID.

L'identifiant et le mot de passe sont identiques à ceux utilisés pour se connecter en ssh sur Austral.

Lancement d'un service jupyterlab

  1. cliquer sur le bouton Start My Server (au cas ou un service jupyterlab est déjà en cours avec votre identifiant vous avez alors la possibilité soit de vous y connecter soit de l'arrêter).
  2. Choisir un profil de job dans le menu déroulant Select a job profile:
  3. Cliquer sur le bouton Start
  4. le lancement d'un service jupyterlab est alors soumis via Slurm sur le cluster - en cas d'indisponibilité le service ne sera pas démarré
  5. Une fois le service jupyterlab démarré la connexion se fait automatiquement

Profils de jobs disponibles

  • Austral compute - 1 core, 3.5 GB, 8 hours : 1 cpu nœud fin (partition tcourt_intra) 3,5 Go de RAM pendant 8h
  • Austral compute - 16 cores, 56 gb, 8 hours : 16 cpu nœud fin (partition tcourt_intra) 56 Go de RAM pendant 8h
  • Austral HPDA – MIG 4 cores, 12 GB, 1 A100 10 GB 14 SM 56 TC, 8 hours : 1 GPU mig A100 (partition hpda_mig) avec 14 SM 56 TensorCores 10Go de VRAM, 4 cpus 12 Go de RAM pendant 8h
  • Austral HPDA – MIG 4 cores, 12 GB, 1 A100 20 GB 28 SM 108 TC, 8 hours : 1 GPU mig A100 (partition hpda_mig) avec 28 SM 108 TensorCores 20Go de VRAM, 4 cpus 12 Go de RAM pendant 8h
  • Austral HPDA – MIG 4 cores, 12 GB, 1 A100 40 GB 42 SM 164 TC, 8 hours : 1 GPU mig A100 (partition hpda_mig) avec 42 SM 164 TensorCores 40Go de VRAM, 4 cpus 12 Go de RAM pendant 8h
  • Austral HPDA – 8 cores, 60 GB, 1 A100 80 GB 108 SM 432 TC, 8 hours : 1 GPU A100 complet (partition hpda) avec 108 SM, 432 TensorCores et 80Go de VRAM, 8 cpus 60 Go de RAM pendant 8h

Arrêt d'un service jupyterlab

  • Le service est automatiquement interrompu par Slurm à la fin du temps alloué (12h)
  • Le service peut être interrompu depuis la page de connexion de jupyterhub (disponible à partir de jupyterlab via le menu déroulant File -> Hub Control Panel)

Environnements logiciels

Notebooks

Le service permet d'exécuter des notebooks basés sur différents kernels python. L'ensemble des environnements python pour l'IA et le traitement des données installés sur Austral est accessible sur le service :

  • pytorch 1.11.0
  • pytorch 2.0.0
  • tensorflow 2.11.0
  • dask 2023.9.3

De nouveaux kernels seront installés au gré des nouvelles installations sur Austral.

Dashboard

Tensorboard L'outil de monitoring TensorBoard est disponible dans les sessions jupyterlab depuis le Launcher dans la catégorie Other Dask Dashboard Le service Jupyterlab inclut l'extension Dask-labextension qui permet de visualiser différents éléments du Dask Dashboard.


Dernière mise à jour: 14 mars 2024 06:36:59