
Senior Data Engineer (AI & AWS)
Job Description
ABOUT THE ROLE
Buscamos um(a) Data Engineer Sênior com experiência em arquiteturas de dados modernas na AWS e interesse genuíno em Inteligência Artificial e Machine Learning. Nessa posição, você será responsável por construir e manter a infraestrutura de dados que sustenta produtos analíticos, modelos de ML e soluções de GenAI da empresa e de seus clientes. Você vai trabalhar em um ambiente orientado a dados, colaborando com engenheiros, cientistas de dados e times de produto para garantir que os dados certos cheguem às pessoas certas, com qualidade, confiabilidade e escala.
KEY RESPONSIBILITIES
• Projetar e implementar pipelines de ingestão e transformação de dados em batch e real-time de alta escala
• Construir e manter arquiteturas de lakehouse usando AWS S3, Glue, Redshift e Apache Iceberg
• Desenvolver e orquestrar pipelines de ML/AI com AWS SageMaker e Apache Airflow
• Implementar soluções de streaming em tempo real com Apache Kafka e/ou AWS Kinesis
• Explorar e aplicar padrões de GenAI via AWS Bedrock, incluindo pipelines RAG, workflows de embeddings e integração com LLMs
• Aplicar práticas de Data Mesh para descentralizar domínios de dados e melhorar a autonomia dos times
• Garantir qualidade, linhagem e governança de dados com dbt e AWS Glue Data Catalog
• Otimizar custos e performance de queries em ambientes Redshift e Athena
• 5+ anos de experiência como Data Engineer com foco em cloud
• Domínio de Python, PySpark e SQL para processamento e transformação de dados em larga escala
• Experiência sólida com AWS: S3, Glue, Redshift, Athena, Lambda, SageMaker e Kinesis
• Experiência com orquestração de pipelines usando Apache Airflow
• Conhecimento em streaming de dados com Apache Kafka ou AWS Kinesis
• Familiaridade com dbt para transformação e documentação de dados
• Experiência com IaC usando Terraform para provisionamento de infraestrutura de dados
• Conhecimento em Apache Iceberg para gerenciamento de tabelas em data lakes
• Interesse comprovado em IA/ML — experiência com pipelines de ML ou GenAI é um forte diferencial
• AWS Certified Data Analytics – Specialty ou AWS Certified Machine Learning (diferencial)