Skip to content

Curso de pandas usando datos abiertos de carpetas de investigación de la CdMx

License

Notifications You must be signed in to change notification settings

mar-esther23/CursoPandas2020

Repository files navigation

Introducción al análisis y visualización de datos con python

Mariana Esther Martínez Sánchez

Curso básico para análisis de tablas de datos usando python y pandas.

Impartido:

  • Pyladies-México 13 y 14 de febrero de 2020

Requisitos:

  • Saber usar R, SAS, STATA o Excel avanzado.
  • Tener anaconda instalado.
  • Acceso a internet.

Índice

  1. Introducción a python

    1. Instalación de conda
    2. Jupyter notebooks
    3. Introducción a python
  2. Obtención de datos

    1. Descargar datos abiertos
    2. ¿Qué es un dato?
    3. Cargar los datos en python
      • Ubicacion en la carpeta
      • Excel, csv, pickle
  3. Limpieza de datos

    1. Pasos de un análisis de datos
    2. Exploración básica - pandas_profiling
    3. Operaciones básicas de pandas - slicing
      • Estructura de una tabla (index, columns, dtype, nan)
      • select column(s), row(s), head, tail, loc, iloc
      • sort
      • unique, nunique, value_counts
      • select by criteria (==, !=, isin, isna, notna, multiple statements)
    4. Limpieza de datos
      • Quitar columnas (drop, select)
      • Cambiar tipos de datos (datetime)
      • Modificar campos de texto (replace, title, unidecode)
      • Eliminar datos fuera de rango (map, replace)
      • Datos faltantes (fillna)
    5. Guardar datos
      • Excel y cs v * pickle
  4. Gráficación básica

    1. Tipos de gráficas (lines, bars, scatter, hist)
    2. Elementos de una gráfica (title, axis, etc)
    3. matplotlib
  5. Análisis de datos

    1. Estadística básica (count, sum, mean, median, moda, std)
    2. Agrupamiento (groupby, filter, aggregate)
    3. Tablas pivote (pivot_table)
    4. Respondiendo preguntas
  6. Extras

    1. Seaborn (distplot, heatmap, multiples)
    2. Estadística (corr, linear_regresion)
    3. Mapas (geopandas)
    4. Visualización de datos

Recursos útiles

About

Curso de pandas usando datos abiertos de carpetas de investigación de la CdMx

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published