Job Description
Estamos buscando um(a) LLMOps Engineer para sustentar, evoluir e testar a nossa infraestrutura de Inteligência Artificial. Sua missão será garantir que nossas plataformas de IA (Google Gemini Enterprise, Azure Foundry, AWS Agent Core), AI Gateway e Orquestração de Agentes operem com alta disponibilidade, segurança e eficiência de custos.
Mais do que rodar o que já existe, você será peça-chave na validação do futuro da nossa stack, apoiando na homologação de novas tecnologias, liderando testes e desenvolvendo soluções práticas.
Principais Responsabilidades
- Operação de Plataformas Agênticas: Gerenciar e otimizar a camada de agentes e proxies utilizando ferramentas como litellm, GCP Gemini, AWS Agent Core e Azure Foundry.
- Homologação e P&D: Avaliar e homologar novas ferramentas, modelos e tecnologias do ecossistema de GenAI, conduzindo testes de estresse, latência e qualidade, além de desenvolver MVPs/soluções internas.
- Gestão de Gateways e RAG: Configurar rate limiting, failover, load balancing e gerenciar a infraestrutura de bases vetoriais (OpenSearch, Vertex AI Vector Search, etc.).
- Observabilidade e FinOps: Implementar tracing e monitoramento em tempo real (LangFuse, Datadog AI, Grafana) focado em consumo de tokens, latência e otimização de custos de inferência.
- Automação (CI/CD para IA): Criar pipelines automatizados para deploys de IA, incluindo esteiras de avaliação de prompts (Evals) e testes de regressão de modelos.
Requisitos Técnicos (Hard Skills)
- Domínio em IA Agêntica e Gateways: Experiência prática com litellm, GCP Gemini, AWS Agent Core e/ou Azure Foundry/OpenAI.
- Multicloud e IaC: Sólidos conhecimentos nos serviços de GenAI da AWS, Azure ou GCP, além de provisionamento via Terraform.
- Programação: Proficiência em Python (obrigatório para automações e SDKs) .
- DevOps Fundamental: Experiência prática com containers e orquestração (Docker e Kubernetes).
- Arquitetura de Dados para IA: Compreensão de pipelines de RAG e bancos de dados vetoriais.
- Experiência com desenvolvimento de Código com IA (Github Copilot, Claude Code, Codex...)
Diferenciais
- Certificações de Nuvem focadas em IA/ML (AWS, Azure ou GCP).
- Experiência na implementação de LLMs locais (vLLM, Ollama) para otimização de custos.
- Conhecimento em segurança de IA (OWASP Top 10 para LLMs, PII masking)