Curso básico para análisis de tablas de datos usando python y pandas.
Impartido:
- Pyladies-México 13 y 14 de febrero de 2020
- Saber usar R, SAS, STATA o Excel avanzado.
- Tener anaconda instalado.
- Acceso a internet.
-
- Instalación de conda
- Jupyter notebooks
- Introducción a python
-
- Descargar datos abiertos
- ¿Qué es un dato?
- Cargar los datos en python
- Ubicacion en la carpeta
- Excel, csv, pickle
-
- Pasos de un análisis de datos
- Exploración básica - pandas_profiling
- Operaciones básicas de pandas - slicing
- Estructura de una tabla (index, columns, dtype, nan)
- select column(s), row(s), head, tail, loc, iloc
- sort
- unique, nunique, value_counts
- select by criteria (==, !=, isin, isna, notna, multiple statements)
- Limpieza de datos
- Quitar columnas (drop, select)
- Cambiar tipos de datos (datetime)
- Modificar campos de texto (replace, title, unidecode)
- Eliminar datos fuera de rango (map, replace)
- Datos faltantes (fillna)
- Guardar datos
- Excel y cs v * pickle
-
- Tipos de gráficas (lines, bars, scatter, hist)
- Elementos de una gráfica (title, axis, etc)
- matplotlib
-
- Estadística básica (count, sum, mean, median, moda, std)
- Agrupamiento (groupby, filter, aggregate)
- Tablas pivote (pivot_table)
- Respondiendo preguntas
-
Extras
- Seaborn (distplot, heatmap, multiples)
- Estadística (corr, linear_regresion)
- Mapas (geopandas)
- Visualización de datos
-
Programación básica en python
- Think like a computer scientist https://greenteapress.com/wp/think-python/
- Introducción a la programación en Python I https://www.coursera.org/learn/aprendiendo-programar-python
-
Programación intermedia en python
- Guia estilo https://pep8.org/
- Docstrings numpy https://sphinxcontrib-napoleon.readthedocs.io/en/latest/example_numpy.html
- The Hacker's Guide to Python, Julien Danjou
- Computer Science Distilled, Wladston Ferreira Filho
- Estructuras de datos https://classroom.udacity.com/courses/ud513
-
Visualización
- Selección de colores http://colorbrewer2.org/
- Fundamentals of Data Visualization https://serialmentor.com/dataviz/
- Visualización de datos y D3 https://classroom.udacity.com/courses/ud507
-
Estadística
- Estadistica para Dummiens, Deborah J Rumsey
- Understanding Advanced Statistical Methods, Peter H. Westfall & Kevin S. S. Henning
-
Machine learning
- Machine Learning with Python: A Practical Introduction https://www.edx.org/course/machine-learning-with-python-a-practical-introduct
-
<Aprendizaje
- Aprendiendo a aprender https://www.coursera.org/learn/learning-how-to-learn