Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Añadido data, docs, notebooks y reports #3

Merged
merged 34 commits into from
May 21, 2024
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
Show all changes
34 commits
Select commit Hold shift + click to select a range
e148379
base parte 3 a revisar
May 9, 2024
9114e4e
trabajo tarde 9 mayo
May 10, 2024
e57d97d
sugerencias neivys hechas
May 11, 2024
c4c913d
añadidos comentarios del codigo y ya no se eliminan las columnas temp…
May 11, 2024
09dc182
añadido el resumen de cambios en variables
May 11, 2024
c1c6b68
corregidos pequeños detalles
May 12, 2024
4636eb2
cambios hechos reunion 12 de Mayo 11:00
May 12, 2024
1a1dfcb
cambios hasta categorizacion de number of reviews
May 13, 2024
6e36fdc
cambios hasta resumen listos
May 13, 2024
7799cbf
empezando a describir gráficos de variables uno a uno
May 13, 2024
00857f6
hecho hasta reunion del 13_mayo a las 19:00
May 13, 2024
cdcd217
añadido csv raw original
May 14, 2024
4ecc787
version con dataset procesado en csv generado en ruta correcta
May 14, 2024
d23f355
cuaderno del dia 14 de Mayo
May 14, 2024
f518e7f
quitados barrios con cero frecuencias
May 14, 2024
d73b28d
añadido data processed despues de quitar barrios no madrileños
May 14, 2024
761886c
Borradas columnas Availibility y time_since_last_review + Csv procesa…
May 16, 2024
09bfb15
Añadido parte Miriam y Andrea
May 16, 2024
cee038c
test display final cuaderno
May 16, 2024
d9a0154
test con archivo output de R
May 16, 2024
a4017e2
correcciones textos cuaderno R
May 16, 2024
ae1ab6d
añadido index
May 16, 2024
964446e
añadido .rmd file
May 19, 2024
cdc18c8
eliminados archivos extras y corregidas erratas
May 20, 2024
69c1839
añadidas pequeñas modificaciones
May 21, 2024
e071aff
añadido indice a readme
May 21, 2024
2821d03
Merge branch 'indice_readme_final' into 09_mayo_parte3
May 21, 2024
22a2dbb
actualizado index
May 21, 2024
5c83584
añadidas conclusiones
May 21, 2024
95e7d7a
añadida presentacion
May 21, 2024
5c2b658
Update README.md
neiluz May 21, 2024
5eb0a9d
Update README.md
neiluz May 21, 2024
9357895
añadido informe
May 21, 2024
8a0faed
actualizado readme
May 21, 2024
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
36 changes: 26 additions & 10 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,23 @@
# TECH-GIRLS-GLOVO
![madrid](https://github.com/AndreaTJ/Tech-Girls-Glovo/raw/main/docs/banner-madrid.jpg)

# Índice

- [Introducción](#predicción-de-precios-de-airbnb-en-madrid)
- [Estructura del Repositorio](#estructura-del-repositorio)
- [Resultados del proyecto](#resultados-del-proyecto)
- [Arquitectura y Validación de Datos](#arquitectura-y-validación-de-datos)
- [Análisis Exploratorio](#análisis-exploratorio)
- [Visualización de las Métricas](#visualización-de-las-métricas)
- [Pre-procesamiento](#pre-procesamiento)
- [Modelado](#modelado)
- [Pipeline](#pipeline)
- [Conclusiones](#conclusiones)
- [Limitaciones](#limitaciones)
- [Instrucciones de Uso](#instrucciones-de-uso)
- [Licencia](#licencia)
- [Integrantes del Grupo](#integrantes-del-grupo)

# Predicción de Precios de Airbnb en Madrid

Este repositorio contiene el código y la documentación para un proyecto de modelado predictivo destinado a predecir los precios de las habitaciones de Airbnb en Madrid. Se utilizan técnicas de análisis de datos y aprendizaje automático para desarrollar modelos que puedan
Expand Down Expand Up @@ -32,7 +49,7 @@ El repositorio contiene el proyecto para analizar y predecir precios de inmueble
- `data`: Contiene los datasets en formatos raw y processed.
- `docs`: Documentación adicional.
- `notebooks`: Notebooks y scripts utilizados para el análisis y modelado.
- `reports`: Informes generados del proyecto.
- `reports`: Informes generados del proyecto y presentación.

## Resultados del proyecto:
### Arquitectura y Validación de Datos
Expand All @@ -43,9 +60,8 @@ y una gestión eficiente de la base de datos. Es una base para construir platafo
Adiocionalmente se realizó un muestreo inicial y una exploración exhaustiva de los datos para identificar posibles problemas de calidad, como valores nulos y outliers. Además, se llevó a cabo una validación de los datos para garantizar su integridad y coherencia.

### Análisis Exploratorio
Durante el análisis exploratorio de los datos, se detectaron y trataron los outliers y valores nulos, asegurando así la calidad de los datos utilizados en el modelado. Se realizaron visualizaciones informativas, como boxplots e histogramas, para comprender mejor la
distribución de las variables y su relación con el precio de alquiler.
Entre lo mas relevante se puede observar la relación del precio con los barrio y la variabilidad de los datos:
Durante el análisis exploratorio de los datos, se detectaron y trataron los outliers y valores nulos, asegurando así la calidad de los datos utilizados en el modelado. Se realizaron visualizaciones informativas, como boxplots e histogramas, para comprender mejor la distribución de las variables y su relación con el precio de alquiler. Entre lo mas relevante se puede observar la relación del precio con los barrio y la variabilidad de los datos:

![Diagrama de precios](https://github.com/AndreaTJ/Tech-Girls-Glovo/blob/main/docs/precios.png)


Expand Down Expand Up @@ -143,11 +159,11 @@ Sigue las instrucciones en los notebooks o scripts en la carpeta notebooks para
Este proyecto está bajo la licencia MIT. Puedes ver los detalles de la licencia en el archivo [LICENSE](LICENSE).

## Integrantes del Grupo
- Andrea Torres Jaramillo: [AndreaTJ](https://github.com/AndreaTJ)
- Clara Garriga: [gmclara](https://github.com/gmclara)
- Elsa Toledo Gómez: [ELSATOLEDO](https://github.com/ELSATOLEDO)
- Miriam Moreira Rubio: [MiriamM](https://github.com/Mimoru93)
- Neivys González Gómez: [NeivysG](https://github.com/neiluz)
- Viviana Pico Paredes: [VivianaPico](https://github.com/VivianaPico)
- Andrea Torres Jaramillo: [AndreaTJ](https://www.linkedin.com/in/andrea-torres-j/)
- Clara Garriga: [gmclara](https://www.linkedin.com/in/claragarrigam/)
- Elsa Toledo Gómez: [ELSATOLEDO](https://www.linkedin.com/in/elsa-toledo-aa355b289/)
- Miriam Moreira Rubio: [MiriamM](https://www.linkedin.com/in/miriam-moreira-rubio/)
- Neivys González Gómez: [NeivysG](https://www.linkedin.com/in/neivyslgonzalezg/)
- Viviana Pico Paredes: [VivianaPico](https://www.linkedin.com/in/viviana-pico/)


Empty file removed data/processed/.gitkeep
Empty file.
21,326 changes: 21,326 additions & 0 deletions data/processed/processed-air-bnb-listings.csv

Large diffs are not rendered by default.

Empty file removed data/raw/.gitkeep
Empty file.
21,349 changes: 21,349 additions & 0 deletions data/raw/air-bnb-listings.csv

Large diffs are not rendered by default.

Empty file removed docs/.gitkeep
Empty file.
7,711 changes: 7,711 additions & 0 deletions docs/index.html

Large diffs are not rendered by default.

Empty file removed notebooks/.gitkeep
Empty file.
Loading