SRE

Oportunidade para Site Reliability Engineer (SRE) com foco em garantir confiabilidade, automação e alta disponibilidade de sistemas críticos. Responsável por suporte N2/N3, análise de causa raiz, acompanhamento de faturamento, arrecadação e melhoria contínua da plataforma. Requer Espanhol fluente, domínio de Linux, scripting (Shell/Powershell), automação com Terraform/CloudFormation/Pulumi, CI/CD (Jenkins/GitLab), Docker e noções de Kubernetes. Experiência em cloud (AWS, Azure ou GCP), observabilidade (Splunk, Prometheus, Grafana, CloudWatch) e práticas de Chaos Engineering. Desejável conhecimento em linguagens como Java, Kotlin, Go, Python, Ruby ou Rust e vivência em ambientes críticos, preferencialmente no setor Telecom.

Brasil SP São Paulo Remota

Responsabilidades

Suporte e resolução de chamados de 2º e 3º níveis. (análise e direcionamento de causa raiz);
Acompanhamento dos ciclos de faturamento (Billing) para garantir entregas (emissão de faturas, entregas fiscais e contábeis etc.);
Acompanhamento dos fluxos diários de arrecadação e cobrança para garantir entregas ao negócio.
Ajuda o tech lead/Liderança a resolver problemas de confiabilidade e prioriza nas atividades do projeto, dado os desafios de negócio e das necessidades da solução.
É proativo ao pedir feedbacks, escuta e evolui continuamente.
É autodidata, aprende coisas novas com regularidade por iniciativa própria.
Se atenta a o que outros projetos já fizeram e traz experiências passadas para o projeto atual, visando minimizar erros.
Se adapta rapidamente frente às mudanças do projeto como novas tarefas, repriorização, apoios técnicos.
Manter a qualidade das soluções desenvolvidas independente da complexidade da tarefa ou processo a ser melhorado.
Tem o “radar” ligado, se preocupa com riscos, premissas e se mobiliza para alcançar os objetivos traçados com o time.
Alta capacidade de fazer acontecer assuntos complexos, dada sua mobilização, criatividade e experiências passadas.
Mantém-se focado em tornar os produtos confiáveis.
Mapeamento do estado atual para identificar possíveis melhorias e tornar a plataforma mais resiliente.

Requisitos

Espanhol obrigatório
Experiência em Sistema Operacional Linux (ex: Debian, Red Hat, etc) modo texto.
Criação de scripts em Shell Script ou Powershell
Automatização em Terraform | CloudFormation | Pulumi *
GIT
Saber fazer CI/CD
Experiência com Jenkins ou Gitlab
Experiência com Docker
Noções de Kubernetes
Conhecimento de Cloud Platforms : AWS | AZURE ou GCP
Experiência ter trabalhado em times ágeis
Ter experiência em estimar prazos e participar planning backlog;
Saber desenvolver soluções com docker e docker-compose para microserviços, APIs,etc..
Automações são eficientes e possuem certo grau de escalabilidade quando necessário (adaptabilidade, performance e confiabilidade).
Tem domínio na criação de alertas e métricas essenciais para os sistemas através de ferramentas ou serviços como Splunk, Prometheus, Grafana, Cloud Watch, etc.
Suas soluções e aprendizados são compartilhados com o time, a comunidade.
Executa e/ou suporta Chaos Engineering através de ferramentas de testes de desempenho, falha, etc. (Ex: Jmeter, P4All)

Descrição perfil técnico desejável:

Tem domínio técnico da linguagem de desenvolvimento de soluções, assim como também para Cloud, Segurança e Performance.
Constrói automações ou recursos de fácil reuso e manutenção.
Identifica causas-raízes, aplica sessões de postmortem diminuindo a complexidade ao lidar com futuros incidentes.
Dissemina sua solução técnica, preocupado em torná-la referência principalmente para outros SREs.
Implanta diretrizes de confiabilidade em suas soluções e dá apoio técnico para que o time faça o mesmo.
Implanta métricas, alertas, para deixar as soluções aderente ao negócio e a experiência do cliente.
Executa automação de deploy contínuo para evitar tarefas repetitivas.
Experiência em Cloud Platform : AWS, Azure ou GCP
Orquestração em Kubernetes
Experiência em CI/CD
Ferramentas de Observability
Experiência em ferramentas de deploy contínuo (Terraform, Puppet)
Mindset de “Automatize tudo que for possível”
Experiência em infraestrutura de Codigo : Terraform & Cloudformation
Conhecimento de alguma linguagem de programação : Java, Kotlin, Go, Python, Ruby ou Rust.
Vivência em lidar com ambientes críticos ou alta escalabilidade.
Experiência na prestação de serviços para empresas do segmento de Telecom.

CANDIDATAR-SE

Mais informações: Remoto. Atuação em horário do México, diferenciado do Brasil (madrugada entre 19h- 3h Brasil).

SRE

Responsabilidades

Requisitos

Nível de experiência: Sênior

Tipo de alocação: Remota

SRE

Responsabilidades

Requisitos

Nível de experiência: Sênior

Tipo de alocação: Remota

Fale Conosco

Talk to Us

Banco de Currículos