Site Reliability Engineer (expérimenté, CDI)

Back to all jobs
  • ALTEN
  • Valbonne, PAC
  • Full-Time
  • 4 days ago
Published
May 18, 2026
Location
Valbonne, France
Category
Job Type

Site Reliability Engineer (expérimenté, CDI): our view in 3 lines...

  • The Role: An experienced SRE role responsible for maintaining, optimising and securing production infrastructure and ensuring service reliability for IT clients.
  • The Person: The person will maintain production systems, automate deployments and monitoring, design reliability improvements, analyse incidents to reduce MTTR, and create and track SLI/SLO/SLA metrics.
  • Requirements: Experience with Linux/Unix, Prometheus, Grafana, Datadog, ELK Stack, scripting in Python or Bash, CI/CD tools such as Jenkins, GitLab CI or GitHub Actions, Terraform and Ansible, Docker and Kubernetes, cloud platforms AWS GCP or Azure, and SQL and NoSQL databases.

Job Description

Description de l'entreprise

ALTEN Sophia Antipolis intervient auprès des grands acteurs de l’IT de la technopole. Nous sommes parmi les leaders du conseil en ingénierie et technologie. Fort de nos 37 000 collaborateurs et de notre implantation dans plus de 28 pays, nous apportons des solutions innovantes pour contribuer aux projets et au développement de nos clients issus de secteurs d’activité variés.

Description du poste

En tant que Site Reliability Engineer (SRE), vous jouerez un rôle clé dans le maintien, l’optimisation et la sécurisation des infrastructures informatiques et des systèmes de production. Vous travaillerez en collaboration avec les équipes de développement, d’infrastructure et d’opérations pour garantir une disponibilité et une résilience maximales des services et applications critiques.

 

Missions principales: 

 

  • Maintien en conditions opérationnelles des systèmes et des applications en production, en optimisant leur disponibilité, performance et évolutivité.
  • Automatisation des tâches répétitives et des processus de déploiement, de surveillance et d’alerting.
  • Conception et mise en œuvre de solutions permettant d’améliorer la fiabilité des systèmes et de réduire le taux de pannes.
  • Analyse des incidents et gestion des urgences, avec pour objectif de diminuer le Mean Time To Recovery (MTTR) et d’accroître la résilience.
  • Optimisation des performances des applications et de l’infrastructure, notamment via la gestion des capacités et des coûts.
  • Collaboration avec les équipes de développement pour favoriser une approche DevOps et intégrer les pratiques SRE dès les phases de conception.
  • Création et suivi de métriques pour mesurer la fiabilité et les performances des systèmes (SLI, SLO, SLA).
  • Veille technologique pour assurer l’amélioration continue des outils et des processus SRE.

Qualifications

Compétences requises:

  • Expérience en ingénierie système : Linux/Unix, gestion de serveurs, stockage, et réseaux.
  • Maîtrise des outils de monitoring et d’alerting (ex. : Prometheus, Grafana, Datadog, ELK Stack).
  • Compétences en automatisation : scripting (Python, Bash, etc.), outils de CI/CD (ex. : Jenkins, GitLab CI, GitHub Actions), et infrastructure-as-code (Terraform, Ansible).
  • Expérience avec les environnements cloud : AWS, GCP, Azure ou autres services cloud, ainsi que les architectures de microservices et conteneurs (Docker, Kubernetes).
  • Compétences en bases de données : administration et optimisation de bases SQL et NoSQL.
  • Capacité à gérer les incidents : compétences en diagnostic et résolution de pannes dans un environnement de production.
  • Bonnes compétences en communication pour collaborer avec des équipes pluridisciplinaires et documenter les processus et solutions.

Compétences bonus

  • Expérience en tant que DevOps ingénieur système ou développeur logiciel
  • Connaissance des méthodologies de développement agile et des pratiques DevOps
  • Participation à la mise en place de processus d'observabilité, de monitoring et de gestion des incidents
  • Expérience dans la gestion de la disponibilité et de la performance 
  • Résistance au stress et capacité à travailler efficacement en cas d’incidents critiques.

Informations complémentaires

Type de contrat: CDI, temps plein. 

PAS DE FULL REMOTE POSSIBLE. 

 

  • Contract Type: Permanent
  • Region: Provence-Alpes-Côte d'Azur
  • Key Skills
    ? Key Skills in dark blue have been inferred based on similar industry roles
    Linux/unix Datadog ELK Stack Bash Jenkins Gitlab CI SQL Nosql AWS Azure Python Kubernetes Terraform Prometheus Grafana

    Subscribe to Career Resources

    Get the latest career advice, industry insights, and job opportunities delivered to your inbox.