Trabajo de Fin de Grado - Álvaro Sánchez Pérez

Este repositorio contiene el trabajo de fin de grado, donde se aborda el aprendizaje y aplicación de los fundamentos de computación distribuida con Spark. El objetivo es ejecutar diferentes consultas con distinto grado de complejidad, visualizando y analizando los resultados de manera gráfica. Además se realizara el despliegue de las consultas en cluster AWS. Para el proyecto se trabajará con datos meteorológicos obtenidos de la página oficial de la AEMET.

Actividades Desarrolladas

Obtención de datos meteorológicos a través de la página oficial de la AEMET.
Desarrollo de consultas básicas con Spark en Scala.
Creación y configuración de un cluster de computación distribuida en Amazon Web Services para su uso con Spark.
Desarrollo de queries complejas para ilustrar buenas prácticas en el uso eficiente del cluster y aprovechamiento de las técnicas de optimización de Spark.
Visualización de los resultados de las consultas mediante librerías del ecosistema de Scala y Python.
Análisis de los resultados obtenidos para obtener conclusiones.

Enlaces

A continuación se encuentran enlaces a los recursos que pueden resultar de interés:

Descarga de los datos

En caso de querer hacer uso de los datos que se emplearon para el proyecto, puedes descargarlos en formato Parquet desde el contenedor S3 de AWS siguiendo estos pasos:

Primero de todo se deberá disponer de AWS Cli para poder ejecutar comandos de AWS. En caso de no disponer de este, puedes obtener más información sobre cómo descargarlo en esta página
Ejecutar el siguiente comando para realizar la descarga de los datos:
```
aws s3 sync url_del_contenedor nombre_carpeta_destino
```
En nuestro caso, el comando se vería así:
```
aws s3 sync s3://tfg-alvaro-sanchez data
```

Name		Name	Last commit message	Last commit date
Latest commit History 75 Commits
DescargaDatosPorDias		DescargaDatosPorDias
DescargaDatosPorMeses		DescargaDatosPorMeses
awsHeatWaves		awsHeatWaves
notebooks		notebooks
GifOlasCalor.gif		GifOlasCalor.gif
Memoria.docx		Memoria.docx
Memoria.pdf		Memoria.pdf
Presentación.pdf		Presentación.pdf
Presentación.pptx		Presentación.pptx
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Trabajo de Fin de Grado - Álvaro Sánchez Pérez

Actividades Desarrolladas

Enlaces

Descarga de los datos

About

Uh oh!

Releases

Packages

Uh oh!

Languages

alvarosanche2/TFGAlvaroSanchez

Folders and files

Latest commit

History

Repository files navigation

Trabajo de Fin de Grado - Álvaro Sánchez Pérez

Actividades Desarrolladas

Enlaces

Descarga de los datos

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages