Este repositório reúne projetos práticos desenvolvidos com foco em Data Science, cobrindo as principais etapas do pipeline de dados: análise exploratória, estatística, machine learning e disponibilização de modelos.
Os projetos foram construídos com o objetivo de aplicar conceitos teóricos em problemas reais, reforçando boas práticas como validação de modelos, análise crítica dos resultados e clareza na comunicação dos insights.
Meu foco é atuar como Data Scientist Júnior, com forte interesse em aprendizado contínuo, tomada de decisão orientada a dados e resolução de problemas de negócio.
📁 MachineLearning/
Projeto de Machine Learning utilizando Filtragem Colaborativa com Matrix Factorization (SVD) aplicado ao dataset MovieLens 100k.
Destaques do projeto:
- Análise e preparação de dados de avaliações de usuários
- Treinamento de modelo SVD com validação por RMSE
- Geração de recomendações personalizadas (Top-N)
Competências demonstradas: Machine Learning clássico, avaliação de modelos e recomendação personalizada
📁 Recommender_API/
Extensão do projeto de recomendação, com foco em disponibilizar o modelo treinado por meio de uma API, simulando um cenário de uso real.
Destaques do projeto:
- Carregamento de modelo previamente treinado
- Criação de endpoints para geração de recomendações
- Uso de Docker para padronização do ambiente
- Separação entre treinamento e consumo do modelo
Competências demonstradas: Integração entre Data Science e Engenharia, noções de MLOps e entrega de modelos para consumo externo.
📁 Testing/
Projeto voltado para análise estatística, com foco em testes de hipótese e A/B Testing, simulando decisões orientadas por dados.
Destaques do projeto:
- Definição clara de hipóteses nula e alternativa
- Aplicação de testes estatísticos adequados ao cenário
- Interpretação dos resultados com foco em tomada de decisão
- Discussão de significância estatística e limitações
Competências demonstradas: Estatística aplicada, raciocínio analítico e suporte à decisão baseada em dados.
📁 Exploratory Data Analysis/
Projeto focado em Exploratory Data Analysis, etapa essencial para compreensão dos dados antes de qualquer modelagem.
Destaques do projeto:
- Limpeza e tratamento de dados
- Análise de distribuições e correlações
- Visualizações para identificação de padrões e anomalias
- Geração de insights iniciais
Competências demonstradas: Compreensão de dados, visualização, storytelling com dados e preparação para modelagem.
- Python
- Pandas, NumPy
- Matplotlib, Seaborn
- Scikit-learn / Scikit-surprise
- Docker
- Git e GitHub
Atuar como Data Scientist Júnior, contribuindo com análises, modelos e insights que apoiem decisões de negócio, enquanto desenvolvo continuamente minhas habilidades técnicas e analíticas.