Responsabilidades
- Implantação de algoritmos e sistemas de ML;
- Garantir a implementação, operação e otimização de pipelines de Machine Learning, desde o desenvolvimento até a produção, assegurando confiabilidade, escalabilidade e eficiência dos modelos.
- Desenho e implementação de solução E2E usando pipelines On-Premisses e Cloud;
- Colaborar com times de Data Science e Engenharia para operacionalizar soluções de ML.
- Estabelecer melhores práticas de MLOps, promovendo governança e eficiência.
- Monitorar e corrigir problemas em pipelines e modelos em produção.
- Trabalho colaborativo;
- Replicação do conhecimento para novos colaboradores e áreas internas.
Requisitos
Descrição perfil técnico:
Experiência com Pipelines de Machine Learning:
- Criação e manutenção de workflows automatizados.
- Familiaridade com ferramentas como Kubeflow, Airflow ou similares.
Versionamento de Dados e Modelos:
- Uso de ferramentas como MLflow, DVC ou outras tecnologias de versionamento.
Integração com Cloud:
- Experiência prática com soluções de AWS (SageMaker), Azure (Machine Learning), ou GCP (Vertex AI).
Monitoramento e Manutenção de Modelos:
- Conhecimento em técnicas de monitoramento de performance, drift de modelos e retreino
Habilidades em Desenvolvimento:
- Proeficiência em linguagens como Python e R.
- Experiência com frameworks de Machine Learning como TensorFlow, PyTorch, ou Scikit-learn
Diferenciais:
- Experiência em metodologias ágeis.
- Conhecimento de sistemas de CI/CD aplicados a ML.
- Habilidade de comunicação para atuar em equipes multidisciplinares.
Requisitos Mínimos:
Formação Acadêmica: Graduação em matemática, física, engenharia, ciência da computação, estatística, análise de sistemas. Mestrado/PhD em ciência de dados, machine learning, ciência da computação, estatística ou disciplina técnica relacionada.
Experiência: Sólida experiência prévia em função relacionada à inteligência baseada em dados, ciência de dados e/ou estatística. Experiência no trabalho com grandes volumes de dados, dados desestruturados e movimentação de dados
Conhecimentos Específicos:
- Engenharia de Software: Desenvolvimento de aplicações com requisitos produtivos de monitoração, alarmes, depuração, alta disponibilidade e integrados com projetos de machine learning;
- Estruturação de Projetos de Machine Learning: Substituição de uma atividade “humana” simples com modelos de Machine Learning, estabelecendo objetivos, métricas e com desempenho similar a um humano;
- Estruturação dos processos de coleta, limpeza dos dados, transformação e técnicas de otimização de modelos, viabilizando a construção de modelos de Machine Learning adequados ao tempo e recursos disponíveis;
- Supervised and Unsupervised Learning
- Reinforcement Learning. Hybrid Learning Problems
- Compreender e resolver problemas de Overfitting e Underfitting
- Algoritmos: Recomendação; Classificação: Regressão Linear, Regressão Logistica ; Clusterização: K-Means e Hierarquica ; Support Vector Machines ; Random Forest ; Redes Neurais e Deep Learning ; Ajustes de Hiperparâmetros, Regularização e Otimização ; Redes Neurais.
- Linguagens: Python, R, Scala, Java
- Frameworks / Bibliotecas: Pandas, Numpy, Scikit-learn, TensorFlow, Keras, Matplotlib, Seaborn.
- Características comportamentais: Interesse contínuo pela pesquisa e aquisição de novos conhecimentos, resiliência para ambientes não estruturados e preocupação com aplicabilidade das soluções e seus impactos no negócio.
CANDIDATAR-SE
Mais informações:
Híbrido sendo 3x presencial em Chácara Santo Antônio (Zona Sul), São Paulo.