Back to jobs
Stefanini Brasil

ENGENHEIRO DE DADOS PL

Brasília, DF, BrasilPosted 1 weeks ago
hybrid

Job Description

Descrição da vaga

Na Stefanini, acreditamos no poder da colaboração. Co-criamos soluções inovadoras em parceria com nossos clientes, combinando tecnologia de ponta, inteligência artificial e a criatividade humana. Estamos na vanguarda da resolução de problemas de negócios, proporcionando impacto real em escala global.


Ao se juntar à Stefanini, você se torna parte de uma jornada global de transformação. Estamos empenhados em criar impacto positivo não apenas nos negócios, mas também na vida de nossos colaboradores. Se você procura uma oportunidade de crescimento profissional em uma empresa que valoriza inovação, respeito, autonomia e parceria, você encontra aqui!

Junte-se a nós e seja parte da mudança!


Modelo de trabalho- Híbrido - DF

#LI-AA2



Responsabilidades e atribuições

Buscamos um(a) Engenheiro(a) de Dados Pleno para atuar na construção e evolução de pipelines de dados voltados à alimentação de soluções de Inteligência Artificial, com foco em RAG (Retrieval-Augmented Generation) e construção de matriz de conhecimento corporativa.

O(a) profissional será responsável por transformar dados estruturados e não estruturados em ativos prontos para consumo por modelos de IA, garantindo qualidade, governança e performance dos dados.


Responsabilidades:

  • Atuar no desenvolvimento de pipelines de ingestão, transformação e enriquecimento de dados para uso em IA
  • Trabalhar com dados estruturados e não estruturados (textos, PDFs, HTML, áudios, entre outros)
  • Implementar processos de chunking, embeddings e indexação vetorial
  • Construir e manter datasets voltados à matriz de conhecimento corporativa
  • Desenvolver pipelines utilizando Databricks (Spark / PySpark)
  • Atuar com arquitetura medalhão (bronze, prata e ouro)
  • Integrar dados com bancos vetoriais (Azure AI Search, pgvector, entre outros)
  • Garantir performance, escalabilidade e confiabilidade dos pipelines
  • Aplicar boas práticas de qualidade de dados (completude, consistência e versionamento)
  • Implementar políticas de atualização, retenção e expurgo de dados
  • Garantir rastreabilidade e auditabilidade dos dados utilizados pelos modelos
  • Atuar em conjunto com times de AI/ML na preparação e otimização de dados
  • Apoiar estratégias de recuperação de informação (RAG)
  • Otimizar dados para melhorar a relevância e precisão das respostas dos modelos


Requisitos e qualificações

Formação

  • Ensino superior completo em Tecnologia da Informação, Engenharia, Sistemas de Informação ou áreas correlatas


Conhecimentos necessários

  • Experiência sólida em engenharia de dados
  • Conhecimento em Python e/ou PySpark
  • Experiência com Databricks e Spark (batch e/ou streaming)
  • Experiência com pipelines de dados (ETL/ELT)
  • Modelagem de dados (Data Lake / Lakehouse)
  • Experiência com dados não estruturados (documentos, textos, etc.)
  • Integração e consumo de APIs


Habilidades técnicas

  • Capacidade de atuar com autonomia na construção de pipelines
  • Conhecimento em arquitetura moderna de dados
  • Experiência com processamento e preparação de dados para IA
  • Atuação em ambientes complexos com múltiplas integrações


Competências comportamentais

  • Capacidade analítica e pensamento estruturado
  • Autonomia e postura investigativa
  • Facilidade para lidar com dados não estruturados
  • Boa comunicação e colaboração com times multidisciplinares


Requisitos desejáveis

  • Experiência com RAG (Retrieval-Augmented Generation)
  • Conhecimento em embeddings e bancos vetoriais
  • Experiência com chunking de documentos
  • Vivência com LangChain ou frameworks similares
  • Conhecimento em OpenAI, Azure OpenAI ou outros LLMs
  • Conhecimento em indexação semântica e busca vetorial
  • Experiência com ingestão de documentos corporativos (PDF, Word, HTML)
  • Vivência com pipelines de dados voltados para IA
  • Experiência em ambientes corporativos complexos ou projetos de grande porte


Informações adicionais

🍛 Vale-alimentação ou vale-refeição;

👨🏼‍🎓 Desconto em cursos, universidades e instituições de idiomas;

📚 Academia Stefanini — plataforma com cursos on-line, gratuitos, atualizados e com certificado;

🗣 Mentoring;

💉 Clube de vantagens para consultas e exames;

🏥 Assistência médica;

🦷 Assistência odontológica;

💰 Clube de vantagens e descontos nos melhores estabelecimentos;

🛫 Clube de viagens;

🐶 Convênio para pets.



See Your Match Score

Sign up and Renata will show you how this job matches your skills and experience.

ENGENHEIRO DE DADOS PL at Stefanini Brasil | Renata