Skip to content

Materiales del curso de Enfoque Estadístico del Aprendizaje de la Maestría de Ciencia de Datos de la Universidad de Buenos Aires.

License

Notifications You must be signed in to change notification settings

eea-uba/EEA-2023

Repository files navigation

EEA-UBA 2023

Ayudantes

Juan Manuel Barriola

Franco Mastelli

Fernando Gonzalez

Clase 1: Fundamentos de programación en R

Presentación / Encuesta inicio de curso

Fundamentos de programación en R: entorno, objectos, estructuras de datos, loops, control flow y funciones

  • [Introducción al entorno R](clase 1/Clase 1 - Introduccion a R.nb.html)
  • [Loops, condicionales y funciones](clase 1/Clase 1 - Loops, condicionales y funciones.nb.html)
  • [Ejercicios](clase 1/Clase 1 - Ejercicios -Consignas .nb.html)
  • [Resueltos](clase 1/Resueltos/Clase 1 - Ejercicios -Resueltos.R)

Datasets para ejercicios

Clase 2: Tidyverse

Introducción al paquete Tidyverse: trabajo con datasets (dplyr y tidyr), fechas (lubridate), strings (stringr) y gráficos (ggplot2)

  • [Tidyverse](clase 2/Clase 2 - Tidyverse.nb.html )
  • [Ejercicios](clase 2/Clase 2 - Ejercicios.nb.html )
  • [Resueltos](clase 2/resueltos)

Datasets para ejercicios

Material opcional

  • [Gráficos de kernels y tendencias](clase 2/Clase 2 - Kernels y Tendencias (OPCIONAL).nb.html)
  • [Distintos tipos de Join](clase 2/Clase 2. Distintos tipos de Join (OPCIONAL).nb.html)

Clase 3: Correlación y Regresión Lineal Simple I

Estimación y test de correlación entre 2 variables. Matrices de correlación: librerías corrr y GGally

  • [Correlación](clase 3/Clase-3---Correlacion.html)

Análisis exploratorios, limpieza de datos, análisis de outliers e interpretación de los coeficientes de un modelo lineal simple

  • [Regresión Lineal Simple: Modelo e interpretación](clase 3/Clase-3---Regresion-Lineal-Simple.html)

Dataset Notebook Modelo Lineal

Clase 4: Regresión Lineal Simple II y PURRR

Inferencia sobre los parámetros, test de significatividad global y R-cuadrado

  • [Regresión Lineal Simple: Evaluación y diagnóstico](clase 4/Clase-4---Regresion-Lineal-Simple-Eval.html)

Introducción a programación funcional con Tidyverse PURRR

  • [Tidyverse:PURRR](clase 4/PURRR.nb.html)

Clase 5: Diagnóstico de Regresión Lineal

Diagnóstico de modelo lineal simple

  • [Regresión Lineal Simple: Evaluación y diagnóstico](clase 4/Clase-4---Regresion-Lineal-Simple-Eval.html)

Modelo lineal desde el enfoque de Machine Learning: random search y grid search de parámetros, función objetivo y métodos de optimización para hallar los valores de los parámetros

  • [Regresión Lineal Simple: Enfoque de Machine Learning](clase 5/modelo_lineal_enfoque_ml_resuelto.nb.html)

Un ejemplo de Shiny App sobre Overfitting (basado en https://github.com/apapiu/Shiny-Apps)

  • [Shiny App](clase 5/shiny/overfitting/app.R)

Clase 6: Regresión Lineal Múltiple I

Interpretación de coeficientes en Regresión Lineal Múltiple, inclusión de variables categóricas y test de significatividad individual

  • [Regresión Lineal Múltiple: Parte I](clase 6/Clase 6 - Regresion Lineal Multiple.nb.html)

Dataset Notebook Modelo Lineal Múltiple

Clase 7: Regresión Lineal Múltiple II

Evaluación y diagnóstico del modelo. Explicación vs predicción.

  • [Regresión Lineal Múltiple: Parte II](clase 7/Clase 7 - Regresion Multiple II.nb.html)

Dataset Preprocesado Modelo Lineal Múltiple

  • [Datos Properati Preprocesados](clase 6/properati_preprocesado_2022.csv)

Clase 8: Extensiones de Regresión Lineal

Extensiones del Modelo de Regresión Lineal Múltiple.

  • [Extensiones Modelo Lineal Múltiple](clase 8/Clase 8 - Molelo log(price).nb.html)

Clase 9: Regresión Bayesiana

Regresión Bayesiana

  • [Regresión Bayesiana](clase 9 bis/clase_9_regresion_bayesiana.html)

Construcción datasets NBA

  • [Notebook creación de datasets NBA](clase 10/creacion_datasets_nba.html)

Clase 10: Regresión Logística

Regresión Logística: modelo de clasificación. Interpretación de coeficientes, métricas y gráficos de evaluación del modelo y evaluación de performance.

Problema del desbalanceo de clases: comportamiento del modelo, estrategia de oversampling y su efecto en el modelo

  • [Regresion Logistica](clase 9/logit.nb.html)

Clase 11: Regularización

Regularización: modelos Ridge, Lasso y Elastic Net y trade off sesgo-varianza

  • [Regularizacion: Ridge, Lasso y Elastic Net](clase 10/regularizacion.html)

Datasets para técnicas de regularización

Clase 12: Modelos Aditivos Generalizados: Prophet

Smoothing, GAM y Prophet.

  • [Prophet: implementacion de GAM para series de tiempo](clase 11/prophet_shopping.nb.html)

Clase 14: Redes Neuronales I

Redes Neuronales

  • [Introducción a Redes Neuronales](clase 12/redes_fully_connected.nb.html)

  • [Introducción a tidymodels](clase 11/tidymodels.nb.html)

About

Materiales del curso de Enfoque Estadístico del Aprendizaje de la Maestría de Ciencia de Datos de la Universidad de Buenos Aires.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •  

Languages