Rejoignez l''quipe de notre client en tant qu'' Ingnieur systme Linux HPC afin dassurer un support de type systme sur la pile constructeur compatible RedHat 9 (ou quivalent), sur les systmes de stockages Lustre et devra tre capable de raliser des interventions ponctuelles dexpertise sur les domaines technologiques couverts par la configuration installe.
Il disposera sur site des comptences avances en termes de comprhension des couches logicielles, ainsi que doutils de dveloppement et de dbogage logiciel par exemple comptences SELinux, Lustre, etc...
Vous serez sous la direction de lquipe systme du client qui gre leurs tches et avec laquelle vous travaillerez en troite collaboration.
Le service attendu ici est davoir, sur site, une prestation de type systme sur lensemble des logiciels pour assurer :
la mise en place dvolutions logicielles
la mise en place de contournements temporaires ou correctifs permanents fournis pour corriger des incidents survenus sur le calculateur
lapplication de rsolution de problmes
la mise en place ou lupgrade de nouvelles versions logicielles et la ralisation de modifications de la configuration et doptimisations de celles-ci
l''installation et la maintenance des logiciels, bibliothques (I/O, calcul scientifique, etc.), compilateurs, outils de dbogage et d''analyse de performance pour offrir aux utilisateurs un environnement de dveloppement performant et jour
la prconisation, loptimisation et lamlioration du supercalculateur et de lenvironnement de stockage
le maintien en conditions oprationnelles (MCO) et la scurit des systmes et composants installs
la qualification et le suivi dincidents de type logiciels, nimpactant pas directement la disponibilit en prcisant un niveau de gravit : Majeur/Moyen/Mineur, et transmettre au support logiciel externe, puis suivre jusqu leur rsolution
Cette prestation sur site doit tre un relais efficace vers les quipes de dveloppements externes du prestataire et celles du client
Comptences techniques requises :
- Matrise des environnements Linux serveur : HPC : Slurm, RedHat, Ansible, Supervision // MCO : administration N2, escalade du N1
- Matrise des langages batch Linux
- Matrise des techniques rseaux : Ethernet, InfiniBand