Skip to content

📊 Projects - Data Science and Data Analysis | Projetos de estudos - Ciência de Dados e Análise de Dados (machine learning, deep learning)

Notifications You must be signed in to change notification settings

SarahFeanor/Portfolio-DataScience

Repository files navigation

Linkedin Badge Gmail Badge Python 3.7+ License: GPL v3

Banner Tecnologia

🔗 Visite também >> Portfólio de Power BI e SQL

Portfólio de Ciência de Dados

Bem-vindo(a) ao meu repositório de projetos de Data Science, criado com o propósito de estudo. Aqui, compartilho projetos desenvolvidos para aprimorar minhas habilidades nessa área em constante evolução.

Vale ressaltar que todos os dados são exclusivamente para fins de demonstração, garantindo total privacidade e conformidade ética.

Projetos

⚡️ Análise Explorátoria

  • Análise dos Dados do Airbnb em Tokyo: Este notebook realiza análise dos dados do Airbnb na cidade de Tóquio, Japão. Utilizando ferramentas de análise estatística, o objetivo é compreender os preços médios, os tipos de propriedades disponíveis e suas distribuições geográficas. Adicionalmente, o notebook oferece visualizações e insights relacionados às avaliações dos usuários e às principais preferências buscadas pelos hóspedes.

  • Análise Global da COVID-19: Um panorama global dos dados da COVID-19, empregando ferramentas de visualização para ilustrar a trajetória dos casos confirmados, óbitos e taxas de recuperação em diversas nações. Além disso, o notebook oferece uma investigação dos dados correlacionados à densidade populacional e ao Índice de Desenvolvimento Humano (IDH) dos países, com o intuito de identificar potenciais fatores que impactam a propagação da doença.

Ferramentas: Pandas, Seaborn, Matplotlib

⚡️ Machine Learning

  • Análise de departamento de RH Neste projeto identificamos potenciais elementos que influenciam os pedidos de demissão dos colaboradores. Também aplicamos modelos de machine learning ao conjunto de dados para prever quais funcionários estão mais propensos a sair da empresa e avaliar a eficácia desses modelos com base em métricas como precisão, recall e pontuação.

  • Análise de Risco de Crédito: Neste projeto, empregamos uma base de dados financeira dos clientes com o propósito de construir um modelo de aprendizado de máquina capaz de realizar uma avaliação do risco de crédito. O objetivo principal é antecipar a probabilidade de um cliente não conseguir cumprir suas obrigações financeiras, o que é conhecido como 'default'. Para viabilizar o treinamento do modelo, recorremos a técnicas de pré-processamento que visam preparar os dados de maneira adequada. Esse processo engloba a depuração dos dados, o tratamento de valores faltantes, a conversão de variáveis categóricas em formatos numéricos, bem como a aplicação de estratégias de engenharia de características, seleção de atributos e equilíbrio entre as diferentes classes.

  • Análise de Churn: Antevendo a Perda de Clientes: Neste projeto, empreendemos na criação de um modelo de aprendizado de máquina destinado a antever a taxa de evasão de clientes em uma empresa fictícia. Através da aplicação de técnicas de pré-processamento, exploração analítica e seleção criteriosa de atributos, buscamos aprimorar modelos de classificação, visando prognosticar quais clientes apresentam maior probabilidade de desvinculação da empresa. Além disso, almejamos identificar potenciais determinantes dessa decisão. Nosso desiderato último é capacitar a empresa a adotar medidas preventivas que atenuem a taxa de evasão, elevando, por conseguinte, a retenção de clientes.

  • Detecção de Fraudes em Cartões de Crédito: Neste projeto, utilizamos uma base de dados contendo transações de cartões de crédito, com o propósito de construir um modelo de aprendizado de máquina com habilidades discriminativas para detecção de fraudes. Através da aplicação de técnicas de pré-processamento, análise exploratória e meticulosa seleção de atributos, fomentamos o treinamento de modelos de classificação, com o objetivo de otimizar a identificação de transações fraudulentas e, concomitantemente, reduzir ao mínimo os falsos positivos.

  • Previsão das Variações das Ações da Google Utilizando Regressão Linear: Neste projeto, propomos empregar técnicas de análise, especificamente a regressão linear, para realizar previsões precisas das variações nas ações da Google. O principal propósito é auxiliar investidores a tomar decisões informadas e maximizar seus retornos financeiros. Ao aplicar a regressão linear aos dados históricos das ações da Google, iremos modelar as tendências e os padrões que podem influenciar os movimentos futuros do mercado.

Ferramentas: Sklearn, Imblearn, Pandas, Seaborn, Matplotlib

⚡️ Auto Machine Learning

Ferramentas: Pycaret, Numpy, Sklearn, Imblearn, Pandas, Seaborn, Matplotlib

📚 Skills

Data Scientist | Data Analyst | BI Analyst

  • Possuo conhecimentos em Python com foco em Análise de Dados e Ciência de Dados, bem como habilidades em bibliotecas essenciais como Pandas, Numpy, Scikit-Learn e Matplotlib.

  • Adicionalmente, possuo competências em SQL/MySQL, ETL, Power BI, Excel, DataBricks, criação de narrativas com dados, conhecimentos estatísticos, análises preditivas e interpretação de séries temporais. Essa combinação me capacita a elaborar e avaliar procedimentos e dados em sistemas de bancos de dados, satisfazendo as demandas dos clientes de maneira eficaz. 📊🔍💡

About

📊 Projects - Data Science and Data Analysis | Projetos de estudos - Ciência de Dados e Análise de Dados (machine learning, deep learning)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published