Você fará parte da evolução da nossa plataforma, garantindo confiabilidade, escalabilidade e disponibilidade em um ambiente multiproduto. Atuará ajudando a desenhar e sustentar uma infraestrutura moderna e resiliente. Nosso cenário exige colaboração com múltiplos stakeholders, foco em métricas de confiabilidade (SLOs/SLAs) e visão estratégica para antecipar problemas. Aqui você será referência técnica, apoiando a construção de uma cultura SRE madura em parceria com times de engenharia, dados e produto.
Operar e evoluir nossa infraestrutura em GKE (Google Kubernetes Engine) e ferramentas de IaC (Terraform, Crossplane ou Pulumi).
Garantir resiliência e alta disponibilidade em ambientes multiproduto, monitorando métricas de confiabilidade (SLOs, SLAs, MTTR, MTTD, MTBF).
Automatizar processos e fluxos críticos, melhorando a eficiência operacional e velocidade de entrega.
Colaborar com times de produto e desenvolvimento, traduzindo aspectos técnicos em impactos de negócio.
Ser referência técnica em SRE, apoiando outros engenheiros e fortalecendo a cultura de confiabilidade.
Contribuir na documentação técnica e na definição de boas práticas de arquitetura.
Experiência sólida como SRE em ambientes SaaS de grande porte.
Conhecimento profundo em Kubernetes (produção) e GKE.
Experiência prática com Infraestrutura como Código (Terraform, Crossplane ou Pulumi).
Domínio em Go ou Python para automações e integrações.
Familiaridade com métricas de confiabilidade (SLO, SLA) e experiência em troubleshooting e observabilidade.
Habilidade de comunicação clara e colaborativa, com capacidade de traduzir técnica em impacto de negócio.
Experiência em ambientes multiproduto e atuação com diversos stakeholders.
Vivência em design de arquitetura de sistemas escaláveis.
Conhecimento avançado em métricas de operação (MTTR, MTTD, MTBF).
Participação ativa em comunidades técnicas: artigos, eventos, open source ou mentorias.
Your email won't be used for commercial purposes. Read our Privacy Policy.