NANTES, FR, 44000 PARIS, FR, 75019
Site Reliability Engineer - Data H/F/N
Au sein de votre équipe #OneTeam
-
Être dans la Data Platform d'OVHcloud, c'est faire partie d'une équipe passionnée dédiée à rendre les projets de données accessibles à tous.
-
Vous rejoindrez l'équipe Infrastructure au sein de la PU Analytics, qui est une équipe orientée produit dont le but est de fournir à nos clients une plateforme data moderne qui permet de créer, déployer et automatiser facilement l'analytics et la visualisation de leurs données. La plateforme de données permet de tout faire, du traitement des données à la visualisation d'informations en temps réel basées sur l'intelligence artificielle, avec une sécurité garantie et une évolutivité infinie, le tout dans une plate-forme cloud unifiée. En termes plus globaux, la plateforme de données peut être appliquée à une grande variété de domaines, allant de la recherche à la médecine, de l'ingénierie au marketing, etc.
- En tant que Site Reliability Engineer, vous serez pleinement impliqué dans le cycle de vie de nos produits, des phases de conception et de POC jusqu'au déploiement en production et à la maintenance (RUN). Vous serez responsable de maintenir l'état opérationnel de nos produits et de contribuer à améliorer leur stabilité, leurs performances et leur sécurité, tout en cherchant à automatiser un maximum de processus. Nous nous spécialisons dans les systèmes distribués, alors préparez-vous à travailler avec des clusters de VM, des conteneurs Kubernetes et à relever les défis associés !
Vos principales responsabilités
- Concevoir et mettre en œuvre des stratégies de sécurité pour nos systèmes et applications (certification ISO 27001 et HDS);
- Participer à la gestion des incidents et à l'analyse des menaces afin de réduire les risques de manière proactive ;
- Travailler aux côtés des autres membres de l'équipe, tels que les développeurs logiciels et les autres SRE, pour fournir un soutien et des conseils sur les meilleures façons de concevoir et de maintenir nos services, afin de garantir que les applications soient prêtes pour la production, évolutives, fiables, observables et sécurisées dès le premier jour ;
- Gérer la plateforme sous-jacente 24/7 sur plusieurs Data Centers et participer à la rotation des astreintes ("on call") ;
- Assister (ou faire des présentations !) à divers meetups et participer à certaines des meilleures conférences au monde, comme KubeCon, KubeHuddle, etc. ;
Votre futur impact
Dans 6 mois
- Effectuer de façon autonome vos astreintes.
-
Contribuer au maintien de la plateforme d'observabilité de la Data Platform d'OVHcloud.
#
Compétences requises :
- Solide compréhension des cadres de sécurité (par exemple: SOC 1 & 2, ISO 27001) et des bonnes pratiques.
- Expérience pratique avec des outils de tests d'intrusion et des plateformes de gestion des vulnérabilités.
- Monitoring, debugging et résolution de problèmes de système distribués moyens à large.
- Maitrise des technologies comme ; Kubernetes / Docker / Ansible / Helm ou encore Terraform.
- Compétences de développement : Shell et/ou Go
- Expérience en automatisation et CI/CD
C'est un +
- Connaissance de FluxCD / ArgoCD ou d'autres outils GitOps
- Environment Openstack
Site Reliability Engineer - Data H/F/N
Au sein de votre équipe #OneTeam
-
Être dans la Data Platform d'OVHcloud, c'est faire partie d'une équipe passionnée dédiée à rendre les projets de données accessibles à tous.
-
Vous rejoindrez l'équipe Infrastructure au sein de la PU Analytics, qui est une équipe orientée produit dont le but est de fournir à nos clients une plateforme data moderne qui permet de créer, déployer et automatiser facilement l'analytics et la visualisation de leurs données. La plateforme de données permet de tout faire, du traitement des données à la visualisation d'informations en temps réel basées sur l'intelligence artificielle, avec une sécurité garantie et une évolutivité infinie, le tout dans une plate-forme cloud unifiée. En termes plus globaux, la plateforme de données peut être appliquée à une grande variété de domaines, allant de la recherche à la médecine, de l'ingénierie au marketing, etc.
- En tant que Site Reliability Engineer, vous serez pleinement impliqué dans le cycle de vie de nos produits, des phases de conception et de POC jusqu'au déploiement en production et à la maintenance (RUN). Vous serez responsable de maintenir l'état opérationnel de nos produits et de contribuer à améliorer leur stabilité, leurs performances et leur sécurité, tout en cherchant à automatiser un maximum de processus. Nous nous spécialisons dans les systèmes distribués, alors préparez-vous à travailler avec des clusters de VM, des conteneurs Kubernetes et à relever les défis associés !
Vos principales responsabilités
- Concevoir et mettre en œuvre des stratégies de sécurité pour nos systèmes et applications (certification ISO 27001 et HDS);
- Participer à la gestion des incidents et à l'analyse des menaces afin de réduire les risques de manière proactive ;
- Travailler aux côtés des autres membres de l'équipe, tels que les développeurs logiciels et les autres SRE, pour fournir un soutien et des conseils sur les meilleures façons de concevoir et de maintenir nos services, afin de garantir que les applications soient prêtes pour la production, évolutives, fiables, observables et sécurisées dès le premier jour ;
- Gérer la plateforme sous-jacente 24/7 sur plusieurs Data Centers et participer à la rotation des astreintes ("on call") ;
- Assister (ou faire des présentations !) à divers meetups et participer à certaines des meilleures conférences au monde, comme KubeCon, KubeHuddle, etc. ;
Votre futur impact
Dans 6 mois
- Effectuer de façon autonome vos astreintes.
-
Contribuer au maintien de la plateforme d'observabilité de la Data Platform d'OVHcloud.
#
Compétences requises :
- Solide compréhension des cadres de sécurité (par exemple: SOC 1 & 2, ISO 27001) et des bonnes pratiques.
- Expérience pratique avec des outils de tests d'intrusion et des plateformes de gestion des vulnérabilités.
- Monitoring, debugging et résolution de problèmes de système distribués moyens à large.
- Maitrise des technologies comme ; Kubernetes / Docker / Ansible / Helm ou encore Terraform.
- Compétences de développement : Shell et/ou Go
- Expérience en automatisation et CI/CD
C'est un +
- Connaissance de FluxCD / ArgoCD ou d'autres outils GitOps
- Environment Openstack