Skip to content

Projeto final da disciplina Estatística I do curso Santander Coders em parceria com a AdaTech ministrada pelo professor Damodara Barbosa.

Notifications You must be signed in to change notification settings

MariaPaulaAndrade/projeto-estatistica-I

Repository files navigation

Estatística Descritiva - Analise do Dataset Publico do E-Commerce feito pela Olist

Este projeto consiste no trabalho final de Estatística I da trilha de Data Science do Programa Santander Coders 2024.1.

Instalação

  1. Clone o repositório:
git clone https://github.com/MariaPaulaAndrade/projeto-estatistica-I.git

Dependências

Para instalar as dependências do projeto, execute:

pip install -r requirements.txt

Estrutura do projeto

├── assets
│   └── data_schema.png
├── database
│   ├── olist_customers_dataset.csv
│   ├── olist_geolocation_dataset.csv
│   ├── olist_order_items_dataset.csv
│   ├── olist_order_payments_dataset.csv
│   ├── olist_order_reviews_dataset.csv
│   ├── olist_orders_dataset.csv
│   ├── olist_products_dataset.csv
│   ├── olist_sellers_dataset.csv
│   └── product_category_name_translation.csv
├── enunciado.pdf
├── notebook_projeto.ipynb
├── notebook_storytelling.ipynb
├── README.md
├── requirements.txt

Este é um conjunto de dados públicos de um ecommerce brasileiro com pedidos feitos na Olist Store. O conjunto de dados contém informações sobre 100 mil pedidos realizados entre 2016 e 2018 em diversos marketplaces no Brasil. Suas características permitem visualizar um pedido a partir de várias dimensões: desde o status do pedido, preço, pagamento e desempenho do frete até a localização do cliente, atributos do produto e, finalmente, as avaliações escritas pelos clientes. Também liberamos um conjunto de dados de geolocalização que relaciona os códigos postais brasileiros com coordenadas de latitude/longitude.

Estes são dados comerciais reais, foram anonimizados, e as referências às empresas e parceiros nos textos de avaliação foram substituídas pelos nomes das grandes casas de Game of Thrones.

Contexto

Este conjunto de dados foi gentilmente fornecido pela Olist, a maior loja de departamentos nos marketplaces brasileiros. A Olist conecta pequenas empresas de todo o Brasil a diversos canais, sem complicações e com um único contrato. Esses comerciantes podem vender seus produtos através da Olist Store e enviá-los diretamente aos clientes utilizando os parceiros logísticos da Olist.

Após um cliente comprar o produto na Olist Store, o vendedor é notificado para processar o pedido. Quando o cliente recebe o produto ou a data estimada de entrega é alcançada, o cliente recebe uma pesquisa de satisfação por e-mail, onde pode dar uma nota para a experiência de compra e escrever alguns comentários.

Esquema de Dados

Esquema de Dados

Abordagem Técnica

O arquivo notebook_projeto.ipynb faz uma análise tecnica dos datasets buscando responder:

  • Quais são as variáveis (colunas) neste conjunto de dados e qual é o tipo de cada uma?
  • Há valores ausentes no conjunto de dados?
  • Qual é a estatística descritiva básica para as variáveis numéricas, como média, mediana, mínimo, máximo e desvio padrão?
  • Como as variáveis numéricas estão distribuídas?
  • Existe alguma correlação entre as variáveis numéricas?
  • Como os dados categóricos estão distribuídos?

Abordagem Exploratória

O arquivo notebook_storytelling.ipynb faz uma análise exploratória nos datasets buscando traçar alguma tendência do E-Commerce no Brasil, com foco nas formas de pagamento e nos pedidos.

About

Projeto final da disciplina Estatística I do curso Santander Coders em parceria com a AdaTech ministrada pelo professor Damodara Barbosa.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published