PARIS, FR, 75017 ROUBAIX, FR, 59100
Site Reliability Engineer - F/H/N
Au sein de votre équipe #OneTeam
-
Rejoindre l'équipe Digital Tools, responsable de la chaîne de déploiement, de l'observabilité et des opérations des plateformes OVHcloud (sites e-commerce et espace client).
-
Jouer un rôle central dans la mise en production et la fiabilité des services exposés à des millions d'utilisateurs.
Vos principales responsabilités
-
Concevoir et maintenir les pipelines de déploiement (CI/CD) pour assurer des livraisons fiables et rapides.
-
Piloter le provisioning et la gestion de l'infrastructure (bare metal, VM, containers) via l'Infrastructure as Code (IaC).
-
Orchestrer les workloads sur Kubernetes en garantissant la scalabilité et la résilience des services.
-
Assurer l'amélioration continue de l'observabilité (métriques, logs, alerting, dashboards, post-mortems).
-
Automatiser les opérations récurrentes pour réduire la charge opérationnelle et renforcer la stabilité.
-
Contribuer à la définition des standards d'architecture et des bonnes pratiques de déploiement.
-
Participer aux astreintes et à la gestion des incidents de production pour apporter une réponse structurée.
Votre futur impact
Dans 6 mois
-
Vous aurez pris en main l'écosystème Kubernetes et les pipelines CI/CD existants de l'équipe Digital Tools.
-
Vous aurez contribué à l'automatisation d'au moins un processus opérationnel majeur pour réduire les interventions manuelles.
-
Vous serez pleinement intégré au cycle des astreintes et capable de diagnostiquer les incidents sur les plateformes e-commerce.
Et dans 1 an
-
Vous deviendrez le référent technique sur l'évolution des outils d'observabilité et de monitoring (Prometheus, Grafana).
-
Vous aurez piloté la mise en œuvre de nouveaux standards d'Infrastructure as Code impactant l'ensemble de la chaîne de livraison.
-
Vous proposerez des optimisations architecturales innovantes pour améliorer la résilience globale des services face à de fortes montées en charge.
Compétences requises :
-
Vous justifiez d'une expérience de 5 ans minimum dans un rôle d'ingénieur infrastructure, SRE ou DevOps.
-
Vous maîtrisez les outils d'IaC et de gestion de configuration comme Ansible, Puppet ou Terraform.
-
Vous possédez une expertise avancée en Kubernetes, Docker et les architectures Cloud Native (Helm, Mesh).
-
Vous concevez et exploitez des pipelines CI/CD complexes (GitLab CI, GitHub Actions, ArgoCD).
-
Vous gérez couramment les outils d'observabilité tels que Prometheus, Grafana ou Sentry.
-
Vous développez des scripts d'automatisation en Go, Python ou Bash.
-
Vous parlez et écrivez un anglais technique fluide pour collaborer dans un contexte international.
C'est un +
- Vous avez déjà travaillé sur des plateformes e-commerce à très fort trafic.
Site Reliability Engineer - F/H/N
Au sein de votre équipe #OneTeam
-
Rejoindre l'équipe Digital Tools, responsable de la chaîne de déploiement, de l'observabilité et des opérations des plateformes OVHcloud (sites e-commerce et espace client).
-
Jouer un rôle central dans la mise en production et la fiabilité des services exposés à des millions d'utilisateurs.
Vos principales responsabilités
-
Concevoir et maintenir les pipelines de déploiement (CI/CD) pour assurer des livraisons fiables et rapides.
-
Piloter le provisioning et la gestion de l'infrastructure (bare metal, VM, containers) via l'Infrastructure as Code (IaC).
-
Orchestrer les workloads sur Kubernetes en garantissant la scalabilité et la résilience des services.
-
Assurer l'amélioration continue de l'observabilité (métriques, logs, alerting, dashboards, post-mortems).
-
Automatiser les opérations récurrentes pour réduire la charge opérationnelle et renforcer la stabilité.
-
Contribuer à la définition des standards d'architecture et des bonnes pratiques de déploiement.
-
Participer aux astreintes et à la gestion des incidents de production pour apporter une réponse structurée.
Votre futur impact
Dans 6 mois
-
Vous aurez pris en main l'écosystème Kubernetes et les pipelines CI/CD existants de l'équipe Digital Tools.
-
Vous aurez contribué à l'automatisation d'au moins un processus opérationnel majeur pour réduire les interventions manuelles.
-
Vous serez pleinement intégré au cycle des astreintes et capable de diagnostiquer les incidents sur les plateformes e-commerce.
Et dans 1 an
-
Vous deviendrez le référent technique sur l'évolution des outils d'observabilité et de monitoring (Prometheus, Grafana).
-
Vous aurez piloté la mise en œuvre de nouveaux standards d'Infrastructure as Code impactant l'ensemble de la chaîne de livraison.
-
Vous proposerez des optimisations architecturales innovantes pour améliorer la résilience globale des services face à de fortes montées en charge.
Compétences requises :
-
Vous justifiez d'une expérience de 5 ans minimum dans un rôle d'ingénieur infrastructure, SRE ou DevOps.
-
Vous maîtrisez les outils d'IaC et de gestion de configuration comme Ansible, Puppet ou Terraform.
-
Vous possédez une expertise avancée en Kubernetes, Docker et les architectures Cloud Native (Helm, Mesh).
-
Vous concevez et exploitez des pipelines CI/CD complexes (GitLab CI, GitHub Actions, ArgoCD).
-
Vous gérez couramment les outils d'observabilité tels que Prometheus, Grafana ou Sentry.
-
Vous développez des scripts d'automatisation en Go, Python ou Bash.
-
Vous parlez et écrivez un anglais technique fluide pour collaborer dans un contexte international.
C'est un +
- Vous avez déjà travaillé sur des plateformes e-commerce à très fort trafic.