CDI
IT, Technologie & Produit
CESSON-SEVIGNE, FR, 35510 TOULOUSE, FR, 31000 LYON, FR, 69003 ROUBAIX, FR, 59100
Hybride
Hybride
Site Reliability Engineer H/F/N
Au sein de votre équipe NOS
- Vous intégrerez une équipe internationale (principalement basée en France et au Canada), dédiée aux opérations de notre produit "Hosted Private Cloud" (ou HPC).
- Vous serez en charge du maintien en conditions opérationnelles de ce produit, afin de garantir les engagements de service qu'OVHcloud prend auprès de ses clients.
Vos principales responsabilités
- Assurer le maintien en conditions opérationnelles du produit HPC, en participant à la gestion des incidents, des changements, et des problèmes dans le cadre des processus établis;
- Résoudre les alertes techniques et les incidents remontés par nos sondes de surveillance ou remontés par nos équipes opérationnelles;
- Alimenter de manière rigoureuse la base de connaissances de notre produit HPC;
- Implémenter des correctifs dans le code source du produit HPC afin d'empêcher toute reproduction d'un incident;
- Implémentez une amélioration sur le produit HPC lorsque vous en identifiez une;
- Participer à la rédaction et à l'exécution des « post mortems » des incidents majeurs afin d'identifier et de réaliser les plans d'action nécessaires à l'amélioration de la qualité de nos services;
- Veiller à l'amélioration de l'observabilité du produit HPC, en implémentant des sondes, alertes associées et indicateurs de suivis;
- Travailler sur un produit en constante évolution basé sur les technologies VMware, Veeam, et Zerto;
- Faire preuve de polyvalence et d'ingéniosité technique pour répondre aux problématiques.
xx
Compétences requises :
- Formation en informatique ou en technologie de l’information
- Expérience d'au moins 3 ans dans un rôle en administration de système ou de SRE
- Très bonne maîtrise des environnements Linux
- Experience avec la technologie VMware (lignes de commande)
- Expérience avec des technologies de management d'infrastructure ansible, terraform, bastion
- Expérience significative en développement, idéalement dans le langage Perl, Go ou Python
- Experience dans le developement logiciel en equipe
- Experience avec les outils de développement tel que git ou jira
- Bonne compréhension des environnements réseau complexes sécurisés
- Maitrise de l’anglais de niveau intermédiaire, parlé et écrit
- Autonomie et sens analytique
- Esprit autodidacte
- Capacité de s'adapter dans un environnement en constante évolution
C'est un +
- Connaissance ou expérience avec Veeam
- Experience liée à la sécurité de l’environnement
- Experience ou connaissance sur le hardenning à l’échelle
- Experience avec la méthode agile
1. Échange dans les 2 à 4 semaines avec notre hiring officer:
Julie
2. Entretien avec le manager:
Morgan
Site Reliability Engineer H/F/N
Au sein de votre équipe NOS
- Vous intégrerez une équipe internationale (principalement basée en France et au Canada), dédiée aux opérations de notre produit "Hosted Private Cloud" (ou HPC).
- Vous serez en charge du maintien en conditions opérationnelles de ce produit, afin de garantir les engagements de service qu'OVHcloud prend auprès de ses clients.
Vos principales responsabilités
- Assurer le maintien en conditions opérationnelles du produit HPC, en participant à la gestion des incidents, des changements, et des problèmes dans le cadre des processus établis;
- Résoudre les alertes techniques et les incidents remontés par nos sondes de surveillance ou remontés par nos équipes opérationnelles;
- Alimenter de manière rigoureuse la base de connaissances de notre produit HPC;
- Implémenter des correctifs dans le code source du produit HPC afin d'empêcher toute reproduction d'un incident;
- Implémentez une amélioration sur le produit HPC lorsque vous en identifiez une;
- Participer à la rédaction et à l'exécution des « post mortems » des incidents majeurs afin d'identifier et de réaliser les plans d'action nécessaires à l'amélioration de la qualité de nos services;
- Veiller à l'amélioration de l'observabilité du produit HPC, en implémentant des sondes, alertes associées et indicateurs de suivis;
- Travailler sur un produit en constante évolution basé sur les technologies VMware, Veeam, et Zerto;
- Faire preuve de polyvalence et d'ingéniosité technique pour répondre aux problématiques.
xx
Compétences requises :
- Formation en informatique ou en technologie de l’information
- Expérience d'au moins 3 ans dans un rôle en administration de système ou de SRE
- Très bonne maîtrise des environnements Linux
- Experience avec la technologie VMware (lignes de commande)
- Expérience avec des technologies de management d'infrastructure ansible, terraform, bastion
- Expérience significative en développement, idéalement dans le langage Perl, Go ou Python
- Experience dans le developement logiciel en equipe
- Experience avec les outils de développement tel que git ou jira
- Bonne compréhension des environnements réseau complexes sécurisés
- Maitrise de l’anglais de niveau intermédiaire, parlé et écrit
- Autonomie et sens analytique
- Esprit autodidacte
- Capacité de s'adapter dans un environnement en constante évolution
C'est un +
- Connaissance ou expérience avec Veeam
- Experience liée à la sécurité de l’environnement
- Experience ou connaissance sur le hardenning à l’échelle
- Experience avec la méthode agile