Nous disposons d’une infrastructure GCP solide et opérationnelle. Nous cherchons à renforcer notre équipe pour soutenir la croissance et l’évolution de nos plateformes, optimiser notre écosystème Virtual Machines/Cloud Run/Kubernetes et développer davantage nos pratiques GitOps avec ArgoCD.
En tant que Senior Devops/Platform Engineer, vous serez au cœur de l’évolution et de la fiabilisation de cette plateforme. Vous interviendrez pour renforcer l’infrastructure existante, améliorer les processus de déploiement et promouvoir les bonnes pratiques DevOps.
Optimisation et évolution de l’infrastructure GCP
Collaborer avec l’équipe pour analyser l’architecture en place et identifier les pistes d’optimisation.
Maintenir et faire évoluer les ressources GCP (Compute, Networking, IAM, etc.) via Terraform en mode Infrastructure-as-Code.
Garantir la haute disponibilité, la résilience et la sécurité de l’infrastructure.
Gestion et amélioration de notre stack Virtual Machines/Cloud Run/Kubernetes
Administrer et faire évoluer les clusters Kubernetes (GKE) déjà en production.
Automatiser et industrialiser le déploiement des applications en lien avec les équipes de développement (Helm, Operators, etc.).
Veiller à la sécurité, la scalabilité et la performance des clusters.
Mise en place et renforcement de GitOps (ArgoCD)
Développer et améliorer les workflows GitOps sur la base d’ArgoCD pour assurer des déploiements rapides, fiables et traçables.
Créer et maintenir des environnements de test et de production synchronisés avec les référentiels GitLab.
Définir et documenter les bonnes pratiques GitOps pour l’ensemble des équipes.
Supervision et Observabilité
Maintenir et faire évoluer les solutions de monitoring, logging et alerting déjà en place.
Analyser les métriques de performances et résoudre les incidents pour garantir la qualité de service.
Participer à l’amélioration continue des processus d’alerte et de gestion des incidents.
Participation à l’équipe d’astreinte
Contribuer au roulement d’astreinte pour assurer la disponibilité et la fiabilité de la plateforme.
Être réactif(ve) et méthodique dans la résolution des incidents critiques en dehors des heures ouvrées.
Rédiger des rapports d’incident et proposer des mesures d’amélioration pour éviter la récurrence.
Collaboration et Mentoring
Travailler en étroite collaboration avec les équipes internes (Dev, Sécurité, etc.) pour adapter l’infrastructure aux besoins métier.
Former et accompagner les membres de l’équipe sur les bonnes pratiques DevOps, Kubernetes et GitOps.
Participer à la veille technologique et proposer de nouvelles idées et outils pour faire évoluer la plateforme.