Back to jobs
Santander US

Anti-Fraud Spec II - Cientista de Dados Pleno

Sao PauloPosted Yesterday
FULL_TIMEremote

Job Description

Anti-Fraud Spec II - Cientista de Dados Pleno

Country: Brazil

Ao integrar o time de Cyber Security & Anti-Fraud do Santander, você atuará no time que é responsável prevenir fraudes internas e externas, mitigar os riscos de cyber segurança e segurança da informação, em um modelo de centro de defesa alinhado ao modelo de digitalização do banco.

Buscamos Cientista de Dados Pleno para atuar no desenvolvimento, implementação e monitoramento de modelos estatísticos e de Machine Learning voltados à predição de eventos raros, contribuindo para a tomada de decisão baseada em dados e para a mitigação de riscos do negócio.

O profissional fará parte de uma equipe multidisciplinar, atuando desde a exploração e preparação dos dados até a validação, implantação e acompanhamento dos modelos em produção, garantindo robustez, interpretabilidade e geração de valor para o negócio.

Você vai se identificar com a gente se tiver:

Think Customer – Penso no Cliente

Embrace Change – Impulsiono a mudança

Act Now – Atuo com rapidez

Move Together – Trabalho em equipe

Speak Up – Falo abertamente

Aqui, seu papel será: 

  • Desenvolver modelos estatísticos e de Machine Learning para predição de eventos raros.

  • Realizar análises exploratórias de dados (EDA) e identificar padrões, tendências e oportunidades.

  • Tratar bases de dados de grande volume, garantindo qualidade e consistência das informações.

  • Construir pipelines de treinamento, validação e monitoramento de modelos.

  • Definir e acompanhar métricas de performance dos modelos, especialmente em cenários de classes desbalanceadas.

  • Trabalhar em parceria com áreas de negócio para entendimento dos problemas e tradução em soluções analíticas.

  • Realizar documentação técnica e apresentação de resultados para públicos técnicos e executivos.

  • Participar da evolução contínua das práticas de ciência de dados e MLOps da área.

Requisitos Imprescindíveis:

  • Graduação em Matemática, Ciência da Computação, Engenharia, Física ou áreas correlatas.

  • Sólidos conhecimentos em Estatística, Probabilidade e Inferência Estatística.

  • Experiência com modelagem supervisionada para classificação.

  • Conhecimento em técnicas para tratamento de classes desbalanceadas: Oversampling (SMOTE, ADASYN), Undersampling, Class weights, Threshold optimization

  • Conhecimento de métricas adequadas para eventos raros: Precision, Recall, F1-Score, PR-AUC, ROC-AUC e KS

Machine Learning

  • Experiência prática com: Regressão Logística, Random Forest, Gradient Boosting, XGBoost, LightGBM, CatBoost

  • Conhecimento em validação cruzada e prevenção de overfitting.

  • Feature engineering e seleção de variáveis.

Programação e Dados

  • Python avançado.

  • Manipulação de dados com Pandas, NumPy e PySpark.

  • SQL avançado.

  • Experiência com ambientes de processamento distribuído (Databricks, Spark ou similares).

  • Versionamento de código com Git.

Deploy e Monitoramento

  • Experiência em implantação e monitoramento de modelos em produção.

  • Conhecimento em conceitos de MLOps.

  • Monitoramento de drift, performance e estabilidade dos modelos.

Comunicação e Negócio

  • Capacidade de traduzir problemas de negócio em soluções analíticas.

  • Boa comunicação para interação com stakeholders técnicos e não técnicos.

  • Perfil analítico, colaborativo e orientado a resultados.

Requisitos Desejáveis:

  • Pós-graduação, Mestrado ou especializações em Ciência de Dados, Inteligência Artificial ou áreas afins

  • IA Generativa, como a área possui uma squad dedicada a IA Generativa, serão considerados diferenciais:

  • Experiência com LLMs (GPT, Claude, Llama, Gemini ou similares).

  • Engenharia de Prompt (Prompt Engineering).

  • Implementação de aplicações com LangChain, LangGraph ou frameworks equivalentes.

  • Construção de soluções RAG (Retrieval-Augmented Generation).

  • Conhecimento em bancos vetoriais: FAISS, Pinecone, Chroma, Weaviate

  • Avaliação e monitoramento de aplicações GenAI.

  • Experiência com agentes de IA e fluxos multiagentes.

  • Fine-tuning e adaptação de modelos fundacionais.

Engenharia e Arquitetura

  • Experiência com APIs REST.

  • Conhecimento em Docker e Kubernetes.

  • Experiência em ambientes cloud (AWS, Azure ou GCP).

  • CI/CD para projetos de Machine Learning.

Explicabilidade e Governança

  • SHAP, LIME e interpretabilidade de modelos.

  • Governança e documentação de modelos.

  • Conhecimento em regulamentação e gestão de risco de modelos.

# BENEFÍCIOS

Remuneração Variável (PLR + Bônus);

Assistência Médica e Odontológica;

Auxílio Alimentação e Refeição;

Previdência Complementar;

Seguro de Vida;

Auxílio Creche/Babá;

Gympass ou Totalpass;

Vale Transporte;

Programa Nascer;

Be Healthy - Programa que incentiva todos a terem hábitos mais saudáveis;

PAPE - Programa de apoio pessoal especializado

E aí? quer ser chama?

Aqui é o espaço para criar o novo, questionar e desafiar o mercado. É ter a urgência do agoira e do futuro alinhados para atender ao cliente, sempre da melhor forma. É fazer parte de uma empresa global, que valoriza o potencial máximo de cada um  e que preza pela diversidade em todas as suas dimensões. É ser simples, pessoal e justo.

Se isso te chama, vem para o Santander!

#AquiSuaChamaTransforma

#EspecialistadeCyberSecurity&Anti-Fraud #VemProSantander

Anti-Fraud Spec II - Cientista de Dados Pleno at Santander US | Renata