Machine Learning Engineer | MLOps | LLMs & RAG | Cloud (Azure/GCP) | Kubernetes | MLflow
São Paulo, SP • Brasil
📫 ruan.matematica@gmail.com • 📱 +55 (94) 98446-3167
🔗 LinkedIn: https://linkedin.com/in/ruan-carvalho
🎓 Mestrando (UNICAMP) • Bacharel em Matemática (UNIFESSPA)
Sou desenvolvedor de Machine Learning Engineer com mais de 6 anos de experiência no desenvolvimento e operacionalização de soluções de Inteligência Artificial em ambientes de produção, com foco em engenharia de ML, MLOps e IA Generativa.
Minha atuação está concentrada na construção de plataformas de Machine Learning escaláveis, incluindo pipelines de dados e modelos, infraestrutura de MLOps, APIs de inferência e arquiteturas de IA distribuídas em cloud.
Ao longo da minha carreira, trabalhei em projetos de alta criticidade e grande escala para organizações como SABESP, SEFAZ-RS (CAGE), Transpetro, Copel e Fiocruz, implementando soluções que envolvem desde engenharia de dados e treinamento de modelos até deploy, monitoramento e governança de sistemas de IA em produção.
Tenho forte experiência em:
- construção de pipelines end-to-end de Machine Learning
- arquiteturas de IA generativa baseadas em LLMs e RAG
- desenvolvimento de plataformas de MLOps
- integração de modelos com sistemas corporativos e APIs
- implementação de infraestrutura de IA em cloud
- Treinamento de modelos de Aprendizado Profundo (Deep Learning)
Meu objetivo é desenvolver sistemas de inteligência artificial robustos, observáveis e escaláveis, capazes de gerar valor contínuo para produtos e operações.
- MLOps & Platform Engineering: esteiras de ML, CI/CD, Model Registry, observabilidade, drift e rollback
- GenAI & RAG: ingestão de documentos, chunking, embeddings, busca semântica, agentes e APIs de modelos fundacionais
- Cloud & Escalabilidade: deploy em Azure , GCP e AWS, containers e orquestração em Kubernetes
- Treinamento de modelos de Deep Learning: Treinamento e otimização de modelos de Deep Learning, Desenvolvimento e treinamento de modelos de Machine Learning e Deep Learning, Treinamento de redes neurais profundas (Deep Learning)
Linguagens: Python, SQL, PySpark, C# (.NET), C++
ML/DL: Scikit-learn, PyTorch, TensorFlow, Transformers (Hugging Face), XGBoost
GenAI: RAG, embeddings, fine-tuning, LangChain/LlamaIndex (quando aplicável)
MLOps: MLflow (Tracking & Model Registry), Kubeflow, Azure ML Pipelines, DVC
Cloud: Azure (Azure ML, AKS, OpenAI, Cognitive Services), GCP (Vertex AI, BigQuery, Cloud Run), AWS (SageMaker, Lambda)
Deploy: FastAPI, Docker, Kubernetes (AKS), REST APIs
Dados: BigQuery, PostgreSQL/MySQL, Delta/Lakehouse (Databricks/Delta) (quando aplicável)
Alguns repositórios podem estar em processo de publicação/organização. Se quiser ver algum case específico, me chame.
- Pipelines de ingestão (PDF/DOCX/planilhas), OCR, chunking semântico e embeddings
- Indexação vetorial e recuperação contextual (RAG)
- Integração com APIs de LLMs, camadas de segurança e governança
- Pipelines de treino/deploy end-to-end
- MLflow Model Registry com versionamento, promotion e rollback
- CI/CD automatizado e observabilidade (métricas e logs)
- Modelos CNN otimizados para OCR
- Pipeline de treinamento automatizado e inferência performática