Requirements: Spanish
Company: DurnIA TI
Region: Madrid , Community of Madrid
Descripcin de la empresa
DurnIA TI es una consultora enfocada en inteligencia artificial, transformacin digital, consultora tecnolgica, plataformas tecnolgicas y ciberseguridad.
Descripcin del Proyecto
Buscamos para incorporar en nuestro equipo 2 Administradores de Sistemas para servicios de administracin de Sistemas de los sistemas de computacin de altas prestaciones dedicados al clculo cientfico, anlisis masivo de datos e Inteligencia Artificial (IA), incluyendo las tecnologas de clster y los sistemas distribuidos de HPC y VIRTUALIZACIN, que la Agencia Estatal Consejo Superior de Investigaciones Cientficas (CSIC) tiene instalados en su Campus de Serrano
Las tareas para realizar estn dirigidas al apoyo tcnico especializado en las siguientes tareas:
- Nuevas implementaciones sobre la arquitectura HPC existente (Escalabilidad y crecimiento, Estabilidad y disponibilidad, Certificacin del software de usuario final, Paralelizacin,Estrategias de optimizacin de recursos)
- Soporte tcnico de servidores de clculo y clusters
- Soporte e instalacin de aplicaciones
- Mantenimiento hardware de los sistemas
- Pruebas de rendimiento y estabilidad
- Documentacin y definicin de procedimientos de acuerdo con los estndares definidos en la
- Secretara General Adjunta de Informtica (SGAI)
Resumen estimativo del parque informtico actual:
- Supercomputador DRAGO instalado en el Centro de Procesos de Datos localizado en Joaqun Costa 22. 28002 Madrid. est basado en procesadores Intel Xeon Gold 6248R y GPU NVIDIA A100: 250 nodos de cmputo, 12000 cores de CPU, 8 GPUs A100, 48TB de RAM (DDR4 a 2933 MHz), rendimiento mximo terico 1.15 Petaflops, 2 nodos acelerados por GPU que ofrecen 8 GPU NVIDIA A100, 300 GB memoria dedicada GPU y 1TB de RAM CPU, rendimiento mximo terico 5PFlops. Interconexin HDR Infiniband HDR basada en una arquitectura FAT TREE sin bloqueo. Sistema Operativo Rocky Linux 8.5.
- Almacenamiento de disco: 5 PB netos LustreHSM implementado mediante LUSTRE (cubre 2 primeros niveles) y un tercer nivel basado en Librera Quantum SCALAR i6 con cintas LTO-8, implementado con RobinHood. En los prximos meses se ampliar con al menos 8 servidores GPUs para IA, cada servidor con 8 tarjetas GPU modelo NVIDIA H200, al menos 2 servidores con GPUs para renderizado, cada servidor con 2 tarjetas GPU modelo NVIDIA L40S y 30 Servidores con gran capacidad de memoria (FatNodes) compatibles con el actual equipo.
- Mantiene una media de 600 cuentas de usuarios activas/ao que se prev incrementar de forma significativa en los prximos meses cuando se disponga de los nuevos servidores GPUs y FatNodes. Todos los equipos estn basados en S/O Linux Rocky Linux 8.5 y versiones afines. Los equipos podrn modificar por razones tcnicas su sistema operativo en cualquier momento del contrato sin que ello signifique cambio alguno en las condiciones del contrato.
Requisitos:
- Experiencia como Ingeniero de Sistemas de HPC y entornos de virtualizacin.
- Experiencia o conocimientos en Sistemas Operativos Unix, Linux: Derivados de Suse, Red Hat y Debian.
- Experiencia arquitecturas de HPC y Sistemas Distribuidos: Diseo, Configuracin, Administracin y Gestin.
- Experiencia o conocimientos en Networking.
- Experiencia o conocimientos en gestin e implementacin de sistemas de seguridad.
- Experiencia en diseo de topologas y configuracin de redes de baja latencia del tipo: Infiniband, Quadrics, etc.
- Experiencia en Sistemas de Ficheros Distribuidos y Paralelos, principalmente basados en LUSTRE y Almacenamiento Jerrquico HSM (mnimo con 100 nodos y ms de 50 TB de informacin.
Por qu DurnIA?
Salario muy competitivo.
Plan de Formacin en Tecnologa y Gestin de Proyectos
Certificaciones tecnolgicas de ms prestigio
Plan de carrera, seguimiento y evaluacin anual de tu desarrollo profesional.
Plan de retribucin flexible (seguro mdico, transporte, formacin y guardera)
Jornada de Verano de 3 meses (15 Junio - 15 de Septiembre)