SRE

Oportunidade para Site Reliability Engineer (SRE) com foco em garantir confiabilidade, automação e alta disponibilidade de sistemas críticos. Responsável por suporte N2/N3, análise de causa raiz, acompanhamento de faturamento, arrecadação e melhoria contínua da plataforma. Requer Espanhol fluente, domínio de Linux, scripting (Shell/Powershell), automação com Terraform/CloudFormation/Pulumi, CI/CD (Jenkins/GitLab), Docker e noções de Kubernetes. Experiência em cloud (AWS, Azure ou GCP), observabilidade (Splunk, Prometheus, Grafana, CloudWatch) e práticas de Chaos Engineering. Desejável conhecimento em linguagens como Java, Kotlin, Go, Python, Ruby ou Rust e vivência em ambientes críticos, preferencialmente no setor Telecom.
Brasil SP São Paulo Remota

Responsabilidades

  • Suporte e resolução de chamados de 2º e 3º níveis. (análise e direcionamento de causa raiz);
  • Acompanhamento dos ciclos de faturamento (Billing) para garantir entregas (emissão de faturas, entregas fiscais e contábeis etc.);
  • Acompanhamento dos fluxos diários de arrecadação e cobrança para garantir entregas ao negócio.
  • Ajuda o tech lead/Liderança a resolver problemas de confiabilidade e prioriza nas atividades do projeto, dado os desafios de negócio e das necessidades da solução.
  • É proativo ao pedir feedbacks, escuta e evolui continuamente.
  • É autodidata, aprende coisas novas com regularidade por iniciativa própria.
  • Se atenta a o que outros projetos já fizeram e traz experiências passadas para o projeto atual, visando minimizar erros.
  • Se adapta rapidamente frente às mudanças do projeto como novas tarefas, repriorização, apoios técnicos.
  • Manter a qualidade das soluções desenvolvidas independente da complexidade da tarefa ou processo a ser melhorado.
  • Tem o “radar” ligado, se preocupa com riscos, premissas e se mobiliza para alcançar os objetivos traçados com o time.
  • Alta capacidade de fazer acontecer assuntos complexos, dada sua mobilização, criatividade e experiências passadas.
  • Mantém-se focado em tornar os produtos confiáveis.
  • Mapeamento do estado atual para identificar possíveis melhorias e tornar a plataforma mais resiliente.

Requisitos

  • Espanhol obrigatório
  • Experiência em Sistema Operacional Linux (ex: Debian, Red Hat, etc) modo texto.
  • Criação de scripts em Shell Script ou Powershell
  • Automatização em Terraform | CloudFormation | Pulumi *
  • GIT
  • Saber fazer CI/CD
  • Experiência com Jenkins ou Gitlab
  • Experiência com Docker
  • Noções de Kubernetes
  • Conhecimento de Cloud Platforms : AWS | AZURE ou GCP
  • Experiência ter trabalhado em times ágeis
  • Ter experiência em estimar prazos e participar planning backlog;
  • Saber desenvolver soluções com docker e docker-compose para microserviços, APIs,etc..
  • Automações são eficientes e possuem certo grau de escalabilidade quando necessário (adaptabilidade, performance e confiabilidade).
  • Tem domínio na criação de alertas e métricas essenciais para os sistemas através de ferramentas ou serviços como Splunk, Prometheus, Grafana, Cloud Watch, etc.
  • Suas soluções e aprendizados são compartilhados com o time, a comunidade.
  • Executa e/ou suporta Chaos Engineering através de ferramentas de testes de desempenho, falha, etc. (Ex: Jmeter, P4All)

Descrição perfil técnico desejável:

  • Tem domínio técnico da linguagem de desenvolvimento de soluções, assim como também para Cloud, Segurança e Performance.
  • Constrói automações ou recursos de fácil reuso e manutenção.
  • Identifica causas-raízes, aplica sessões de postmortem diminuindo a complexidade ao lidar com futuros incidentes.
  • Dissemina sua solução técnica, preocupado em torná-la referência principalmente para outros SREs.
  • Implanta diretrizes de confiabilidade em suas soluções e dá apoio técnico para que o time faça o mesmo.
  • Implanta métricas, alertas, para deixar as soluções aderente ao negócio e a experiência do cliente.
  • Executa automação de deploy contínuo para evitar tarefas repetitivas.
  • Experiência em Cloud Platform : AWS, Azure ou GCP
  • Orquestração em Kubernetes
  • Experiência em CI/CD
  • Ferramentas de Observability
  • Experiência em ferramentas de deploy contínuo (Terraform, Puppet)
  • Mindset de “Automatize tudo que for possível”
  • Experiência em infraestrutura de Codigo : Terraform & Cloudformation
  • Conhecimento de alguma linguagem de programação : Java, Kotlin, Go, Python, Ruby ou Rust.
  • Vivência em lidar com ambientes críticos ou alta escalabilidade.
  • Experiência na prestação de serviços para empresas do segmento de Telecom.
CANDIDATAR-SE

    Aceito que meus dados sejam utilizados para possibilitar que a Jump Label identifique e entre em contato com o titular dos dados para fins de relacionamento e ações de seleção para vaga.

    Mais informações: Remoto. Atuação em horário do México, diferenciado do Brasil (madrugada entre 19h- 3h Brasil).

    Nível de experiência: Sênior

    Tipo de alocação: Remota