O objetivo deste projeto foi agir como um Cientista de Dados do Santander, desenvolvendo um pipeline ETL (Extract, Transform, Load) capaz de gerar valor real para o negócio. O foco está na personalização em massa de mensagens de marketing para investimentos, unindo automação e Inteligência Artificial.
Durante o desenvolvimento, deparei-me com desafios de ambiente e conectividade. Em vez de interromper o processo, decidi arquitetar uma solução resiliente e independente. Desenvolvi um fluxo de dados modular que garante o funcionamento tanto em nuvem (Google Colab) quanto localmente (VS Code), tratando erros de diretório e garantindo a integridade da fonte de dados via auto-setup.
O projeto segue os três pilares fundamentais da Engenharia de Dados:
-
Extract (Extração) 🔍
- Consumo de dados brutos da API oficial do Santander.
- Implementação de lógica de segurança que gera e lê arquivos
SDW2023.csvautomaticamente, evitando falhas de execução (FileNotFoundError).
-
Transform (Transformação) 🤖
- IA Generativa: Integração com a API da OpenAI (GPT-3.5-Turbo) para atuar como um consultor financeiro virtual.
- Motor de Regras: O sistema analisa o perfil financeiro do cliente e gera recomendações exclusivas (máx. 100 caracteres) com foco em educação financeira e oportunidades de investimento.
-
Load (Carregamento) 🚀
- Atualização dos registros enriquecidos de volta na API via métodos HTTP PUT.
- Exportação final para estruturação de relatórios prontos para uso pelas equipes de marketing.
- Python 3.13: Base para automação e scripts.
- Pandas: Manipulação e análise de dados de alta performance.
- OpenAI API: Processamento de Linguagem Natural (NLP) para personalização.
- Clean Code: Organização modular em funções para garantir manutenibilidade e legibilidade profissional.
- Clonar
git clone [https://github.com/ClaudeanSoares/santander-dev-week-etl.git](https://github.com/ClaudeanSoares/santander-dev-week-etl.git)
- Instalar dependências:
pip install pandas requests openai
- Configurar Chave de API:
- No Colab, utilize os
Secretscom a chaveOPENAI_API_KEY. - No VS Code, configure sua variável de ambiente local.
- No Colab, utilize os
Este projeto foi desenvolvido por Claudean Soares.
"A ciência sem a virtude é uma arma para o mal." — Santo Agostinho
Neste projeto, a técnica foi utilizada com o propósito de criar clareza e auxílio financeiro para o próximo.
Nota: Projeto desenvolvido durante a Santander Dev Week 2025, com o auxílio de IA Generativa para a estruturação do pipeline ETL e resolução de bugs de ambiente local.
Obrigado, Senhor!