📂 Projeto - Grupo 2 | Turma: 1102 - Programa Vem Ser Tech Dados - ADA | Módulo 4 - Técnicas de Programação I (PY)
🔗 Visite também >> Outros PROJETOS do curso - AdaTech
Foto: Torre Eiffel - Fonte: BesthHqWallpapers
Bem-vindos(as) ao nosso repositório do 4ª projeto desenvolvido durante o curso 'Vem Ser Tech Dados' da ADA Tech. Este repositório reflete o progresso e aprendizado conquistados ao longo do módulo de Técnica de Programação I (PY). Tem como foco a realização de um EDA (Exploratory Data Analysis) com os conhecimentos obtidos (Pandas e Numpy).
Vale ressaltar que todos os dados são exclusivamente para fins de demonstração, garantindo total privacidade e conformidade ética.
Integrantes:
Professor:
🔍Este projeto tem como foco a análise exploratória de dados relacionados à cidade de Paris, França, utilizando informações disponibilizadas pelo Inside Airbnb. O objetivo principal é extrair percepções e conhecimentos a partir desses dados, explorando aspectos relevantes do mercado de hospedagem na cidade.
💻 O contexto envolve a simulação da RotaVIP, uma empresa fictícia especializada em roteiros de viagem personalizados, preparando-se para uma reunião estratégica com a Airbnb. A proposta visa integrar os serviços de roteiros da RotaVIP com as facilidades da Airbnb, visando ampliar a base de clientes e proporcionar uma experiência de viagem mais completa e personalizada para usuários de ambas as plataformas.
🗺️ Como analista de Dados da RotaVIP, realizamos uma Análise Exploratória de Dados (EDA) dedicada à cidade de Paris, com ênfase na área de hotelaria. A equipe utilizou dados do Airbnb, uma plataforma global que conecta anfitriões e viajantes. O Airbnb, conhecido por promover transparência e democratização dos dados, disponibiliza informações valiosas através do portal Inside Airbnb.
Os dados que utilizamos foram adquiridos de um arquivo CSV disponibilizado no Inside Airbnb. Os arquivos usados aqui tambem podem ser encontrados neste repositório do Github:
- Listagem - Informações resumidas e métricas (bom para visualizações): listings.csv
id: Identificador único para cada listagem no Airbnb, distinguindo cada propriedade individualmente.name: Nome da propriedade anunciada.host_id: Identificador único para o anfitrião (host) da propriedade.host_name: Nome do anfitriãoneighbourhood_group: Subdivisão geográfica mais ampla, como um distrito ou bairro.neighbourhood: Nome do bairro/ Distrito.latitude: Coordenada de latitude da localização da propriedade.longitude: Coordenada de longitude da localização da propriedade.room_type: Tipo de quarto ou unidade anunciada (por exemplo, "Casa inteira", "Quarto privado", "Compartilhado").price: Valor do aluguel da propriedade por noite.minimum_nights: Número mínimo de noites que um hóspede deve reservar para esta propriedade.number_of_reviews: Total de avaliações que a propriedade recebeu de hóspedes anteriores.last_review: Data da última avaliação/revisão deixada por um hóspede.reviews_per_month: Média de avaliações/revisões que a propriedade recebe por mês.calculated_host_listings_count: Número total de propriedades que o host possui, calculado automaticamente.availability_365: Número de dias em que a propriedade está disponível para reserva ao longo do ano.number_of_reviews_ltm: Número de avaliações que a propriedade recebeu nos últimos doze meses.license: Possível licença ou autorização associada à propriedade.
score: Notas que a propriedade recebeubedroom: Quantidade de quartos (o valor 0 siginifica que se trata de um Studio)bed: Quantidade de Camas (o valor 0 siginifica que se trata de um Studio)bath: Quantidade de Banheiros (o valor 0 siginifica que a locação só tem lavabo)
Acerca do Dataset
Durante a análise do conjunto de dados do Airbnb, identificamos uma condensação de informações na coluna 'name', incluindo elementos como score de avaliação, quantidade de quartos, camas e banheiros. Optamos por destacar esses elementos e criar novas colunas específicas para cada informação relevante.
Limpeza de Dados
Ao explorar a qualidade dos dados, observamos a presença de valores ausentes em várias colunas, sendo a coluna 'neighbourhood_group' a que possui 100% dos valores faltantes. Para garantir a robustez e confiabilidade das análises, aplicamos estratégias como preenchimento de dados ausentes, eliminação de colunas irrelevantes e outras técnicas de imputação, conforme necessário. Decidimos excluir colunas como 'last_review' e 'license', cuja ausência não impacta a continuidade da análise. A coluna 'neighbourhood_group' também foi removida por não apresentar informações úteis. Ao investigar possíveis outliers, notamos que a coluna 'price' e 'minimum_nights' poderiam conter valores discrepantes.
Acerca da EDA
Após o tratamento adequado desses outliers, realizamos uma análise mais aprofundada dos preços médios por bairro, destacando os mais caros e baratos. Além disso, identificamos o menor e o maior preço por bairro, proporcionando insights valiosos sobre a variação de preços.
A análise do tipo de imóvel disponível revelou uma preferência significativa por casas/apartamentos inteiros 67%, seguidos por quartos privativos 7%. Os quartos de hotel, apesar de representarem uma parcela menor 0.83%, tendem a ser consistentemente os mais caros, indicando uma preferência por acomodações mais exclusivas e personalizadas.
A análise também destaca uma variação significativa nas médias de preços dentro de cada bairro, refletindo a diversidade de imóveis disponíveis, desde apartamentos pequenos até grandes mansões. Essa variação é crucial para os usuários do Airbnb, permitindo que encontrem acomodações que atendam às suas necessidades e orçamento específicos.
-
Preço mínimo: 💶 € 10 (equivalente a R$ 54,30)
-
Preço máximo: 💶 € 1.999 (cerca de R$ 10.854.57)
-
A média de preços em Paris :💶 € 204.91 (cerca deR$ 1.112,62)
Problema de negócio
Concluímos que a plataforma Airbnb oferece uma ampla diversidade de tipos de imóveis e faixas de preços, desde opções mais acessíveis até acomodações de luxo. Essa variedade é altamente benéfica para a Rota VIP, pois permitirá a criação de roteiros turísticos personalizados, alinhados aos interesses e orçamento específicos de cada cliente.
Essa abordagem não apenas atende às necessidades variadas dos clientes da Rota VIP, mas também estabelece uma parceria estratégica com o Airbnb. Ao apresentar uma gama diversificada de opções e preços acessíveis, podemos aumentar a visibilidade da Rota VIP, enquanto o Airbnb se beneficia ao incentivar mais pessoas a utilizarem seus serviços.
Ao posicionar o Airbnb como nosso parceiro exclusivo para oferecer comodidade aos clientes, criamos uma sinergia que não apenas fortalece a visibilidade da Rota VIP, mas também proporciona ao Airbnb uma vantagem competitiva ao ser a escolha preferencial para acomodações personalizadas e serviços turísticos. Essa colaboração estratégica pode resultar em benefícios mútuos, promovendo a oferta de experiências turísticas sob medida e incentivando o uso contínuo dos serviços do Airbnb.
Foto: Mapa dos bairros de Paris - Fonte: Paris CityVision
.