MONTRÉAL (QUÉBEC), CA, H3A 2N4
Ingénieur fiabilité de site / SRE, équipe Data H/F/N
Au sein de votre équipe #OneTeam
-
Vous participerez dans le cycle de vie de nos produits, des phases de design et de POC, jusqu'à la mise en production et la phase de maintenance (RUN).
-
Vous serez responsable du maintien en conditions opérationnelles de nos produits et contribuerez à améliorer leur stabilité, leurs performances et leur sécurité, tout en cherchant des moyens d'automatiser un maximum de nos processus.
Vos principales responsabilités
-
Créer un code de haute qualité et soutenable;
-
Collaborer aux côtés des autres membres de l'équipe, composée d'ingénieurs SRE et sécurité, pour fournir un support et des conseils sur les meilleures pratiques de conception et de maintenance de nos services, garantissant ainsi que nos produits soient viables en production, évolutifs, fiables, surveillés (alerte et contrôle) et sécurisés dès le départ;
-
Assurer le bon fonctionnement de la plate-forme sous-jacente 24h/7 dans plusieurs Centre de données et participer aux rotations "on call" (astreintes);
-
Contribuer à la vision OVHcloud Data et à la feuille de route de l'équipe;
-
Assister et/ou participer aux rencontres et aux meilleures conférences mondiales telles que: KubeCon, KubeHuddle, entre autres;
-
Participer aux cérémonies agiles de l'équipe et partager vos idées pour aider l'équipe à s'améliorer en continu.
Votre futur impact
Dans 6 mois
-
Effectuer plusieurs astreintes de façon autonome
-
Déployer de nouvelles fonctionnalités sur une plateforme complexe, couvrant plusieurs zones géographiques
-
Contribuer au maintien de la plateforme d'observabilité de la Data Platform d'OVHcloud
Et dans 1 an
-
Maitriser la méthodologie Agile @scale
-
Gérer l’amélioration continue d'un produit avec une transparence totale envers nos clients, en utilisant des infrastructures basées sur des microservices Kubernetes
-
Veiller à l'optimisation et le développement de l'observabilité de la Data Platform d'OVHcloud
b
Compétences requises :
-
Formation universitaire en génie informatique complétée avec au moins 3 années d’expériences sur un poste similaire
-
Expérience en surveillance, débogage et résolution de problèmes de système distribués de type moyens à large
-
Expérience en automatisation et CI/CD et compétences de développement avec Shell et/ou Go
-
Expérience Kubernetes / Docker / Micro VM / Philosophie « Cloud Native »
-
Connaissances des outils de déploiements tels qu'Ansible, Helm, Terraform, Puppet et Chef
-
Connaissance du français et très bonne maîtrise de l’anglais, écrit et parlé, pour communiquer avec des équipes internationales sur divers sites
-
Orienté.e solution, proactivité et facilité à fournir retours d'expérience, idées et bonnes pratiques pour améliorer le fonctionnement de l'équipe et de nos services
-
Capacité à travailler en autonomie et à documenter le travail pour que d'autres puissent s'en inspirer ou prendre la suite
-
Esprit ouvert et curieux, orienté Data
C'est un +
- Expérience en environnement infonuagique Openstack
Ingénieur fiabilité de site / SRE, équipe Data H/F/N
Au sein de votre équipe #OneTeam
-
Vous participerez dans le cycle de vie de nos produits, des phases de design et de POC, jusqu'à la mise en production et la phase de maintenance (RUN).
-
Vous serez responsable du maintien en conditions opérationnelles de nos produits et contribuerez à améliorer leur stabilité, leurs performances et leur sécurité, tout en cherchant des moyens d'automatiser un maximum de nos processus.
Vos principales responsabilités
-
Créer un code de haute qualité et soutenable;
-
Collaborer aux côtés des autres membres de l'équipe, composée d'ingénieurs SRE et sécurité, pour fournir un support et des conseils sur les meilleures pratiques de conception et de maintenance de nos services, garantissant ainsi que nos produits soient viables en production, évolutifs, fiables, surveillés (alerte et contrôle) et sécurisés dès le départ;
-
Assurer le bon fonctionnement de la plate-forme sous-jacente 24h/7 dans plusieurs Centre de données et participer aux rotations "on call" (astreintes);
-
Contribuer à la vision OVHcloud Data et à la feuille de route de l'équipe;
-
Assister et/ou participer aux rencontres et aux meilleures conférences mondiales telles que: KubeCon, KubeHuddle, entre autres;
-
Participer aux cérémonies agiles de l'équipe et partager vos idées pour aider l'équipe à s'améliorer en continu.
Votre futur impact
Dans 6 mois
-
Effectuer plusieurs astreintes de façon autonome
-
Déployer de nouvelles fonctionnalités sur une plateforme complexe, couvrant plusieurs zones géographiques
-
Contribuer au maintien de la plateforme d'observabilité de la Data Platform d'OVHcloud
Et dans 1 an
-
Maitriser la méthodologie Agile @scale
-
Gérer l’amélioration continue d'un produit avec une transparence totale envers nos clients, en utilisant des infrastructures basées sur des microservices Kubernetes
-
Veiller à l'optimisation et le développement de l'observabilité de la Data Platform d'OVHcloud
b
Compétences requises :
-
Formation universitaire en génie informatique complétée avec au moins 3 années d’expériences sur un poste similaire
-
Expérience en surveillance, débogage et résolution de problèmes de système distribués de type moyens à large
-
Expérience en automatisation et CI/CD et compétences de développement avec Shell et/ou Go
-
Expérience Kubernetes / Docker / Micro VM / Philosophie « Cloud Native »
-
Connaissances des outils de déploiements tels qu'Ansible, Helm, Terraform, Puppet et Chef
-
Connaissance du français et très bonne maîtrise de l’anglais, écrit et parlé, pour communiquer avec des équipes internationales sur divers sites
-
Orienté.e solution, proactivité et facilité à fournir retours d'expérience, idées et bonnes pratiques pour améliorer le fonctionnement de l'équipe et de nos services
-
Capacité à travailler en autonomie et à documenter le travail pour que d'autres puissent s'en inspirer ou prendre la suite
-
Esprit ouvert et curieux, orienté Data
C'est un +
- Expérience en environnement infonuagique Openstack