Mobilité Interne CNRS
Responsable Système Centre de calcul et données IPSL
Contexte
L’Institut Pierre-Simon Laplace (IPSL) est un des centres majeurs de la recherche du climat dans le monde contribuant notamment aux travaux du GIEC. Il regroupe 1 500 chercheurs et ingénieurs issus de 8 laboratoires et 2 équipes associées de la région parisienne travaillant à la compréhension du système Terre sur l’ensemble de ses compartiments (atmosphère, océan, surface continentale, biosphère, pollution…).
Depuis plus de 20 ans, le Centre de Calcul et de Données ESPRI de l’IPSL fournit les ressources informatiques logicielles et matérielles nécessaires à la communauté nationale des sciences du climat et de l’environnement pour faciliter l’acquisition, la collection, l’analyse, le traitement et la diffusion de données.
C’est un centre d’excellence reconnu ayant reçu le Cristal Collectif du CNRS en 2021 dont les nombreuses collaborations en France ou à l’international, la diversité des technologies, l’envergure et la variété des projets traités, préparent l’avenir de la recherche sur le climat et l’étude du changement climatique.
L’agent rejoindra l’équipe ESPRI-Infra en charge des infrastructures informatiques de l’IPSL et composée de cinq ingénieurs spécialisés en administration système, réseaux et sécurité. Il évoluera sous la responsabilité du chef de service au sein d’une équipe dotée d’un périmètre technologique varié et en charge de systèmes critiques pour la gestion des masses de données produites par les pôles de modélisation et d’observation de l’IPSL dans le cadre de projets d’envergures nationale, européenne et internationale.
En raison de la distribution du centre de calcul et de données sur plusieurs sites de l’IPSL, le poste pourra être localisé sur le site Pierre et Marie Curie de Sorbonne Université à Paris ou sur le site de l’École Polytechnique à Palaiseau. Des déplacements ponctuels sur les autres sites de l’IPSL seront également possibles.
Cette fonction ouvre droit à l’Indemnité de Référence pour les Informaticiens.
Description
L’ingénieur recruté sera responsable de l’administration système du Centre de Calcul et de Données ESPRI de l’IPSL comprenant des services de stockage massifs, de calcul HPC, de virtualisation et containérisation dédiés à l’analyse et la distribution de données pour la recherche sur le climat et l’étude du changement climatique.
Activités principales
- Installation et administration des différents calculateurs et serveurs du centre,
- Installation, configuration et administration des systèmes de fichiers parallèles (Lustre),
- Spécification et développement des procédures de déploiement, d’optimisation et d’automatisation des configurations,
- Définition et déploiement des évolutions matérielles et logicielles issues d’une veille technologique et en réponse aux besoins des utilisateurs/chercheurs de l’IPSL,
- Maintenance évolutive de l’infrastructure permettant de garantir la sécurité et les conditions opérationnelles des systèmes de stockage, de calcul et du réseau interne (infiniband),
- Analyse des incidents de production (i.e. diagnostic, résolution et procédure d’anticipation).
Activités secondaires
- Rédiger les documentations techniques et procédures d’exploitation,
- Participer au support et à la formation des utilisateurs du centre de calcul,
- Collaborer avec les équipes chargées de la gestion des données du centre afin de faire évoluer l’ensemble de l’infrastructure de façon cohérente et en respectant les normes et standards de qualité et de sécurité,
- Interagir avec nos partenaires HPC nationaux (CEA, IDRIS, CNES) et mésocentres régionaux et intervenir dans les réseaux métiers et groupes de travail en qualité d’expert système.
Compétences requises
– Maîtrise de l’administration des systèmes d’exploitation LINUX (Rhel, CentOS, Debian ou Ubuntu) et des principaux services (SSH, DNS, DHCP, authentification LDAP, WEB),
– Maîtrise de langages de script (bash, perl ou python),
– Maîtrise d’un système de virtualisation (VMWare, Proxmox),
– Maîtrise d’outils de déploiement (Puppet, Ansible, Spack),
– Maîtrise des outils de versionnement (GIT, Gitlab, SVN).
– Connaissance approfondie des systèmes de gestion de tâches dans le domaine du calcul HPC (Slurm, PBS),
– Connaissance approfondie d’outils de monitoring (Nagios, Prometheus, Grafana),
– Connaissance générale de la sécurité des systèmes,
– Connaissance générale des systèmes de fichiers parallèles et/ou distribués (Lustre, GPFS, Ceph),
– Connaissance générale des architectures micro-services (docker, cingulatirty, kubernetes),
– Connaissance générale des réseaux HPC (Infiniband).
– Anglais technique (connaissance générale), niveau B2 selon le cadre européen commun de référence pour les langues.
Compétences en gestion de projet
– Aptitude à préparer les actions et le plan de travail des changements techniques,
– Rédaction des clauses techniques.
Compétences relationnelles :
– Très bonne capacité à travailler en équipe,
– Bonne facilité à communiquer en interne sur ses activités,
– Bonne capacité à accompagner les utilisateurs (support et formation).