-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathA6_Manipulación básica de datos.Rmd
153 lines (93 loc) · 3.21 KB
/
A6_Manipulación básica de datos.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
---
title: "Sesión 6. ESDA"
author: "Isaías Morales"
date: "27 de noviembre de 2020"
output: html_document
---
```{r setup, include=FALSE}
#knitr::opts_chunk$set(include = T)
knitr::opts_knit$set(root.dir = "E:/10 SSPM_database/02 Código/ejeRcicios")
```
# Cargar librerías
> Todas las necesarias y cuidar los posibles conflictos.
```{r}
library(leaflet)
library(tidyverse)
```
# Cargar tablas o datos
>
```{r Librerías para lectura 2}
# Revisar la forma de separación de valores así como la codificación del archivo.
doc_csv <- read.csv("RNPEDFC.csv",
sep=",",
dec= ".",
header = TRUE,
encoding = "UTF-8" )
```
```{r }
corregir <- function(x){
if ( x == "NO ESPECIFICADO") {x = 999}
else {x = x}
return(x)
} ### Discapacidad
doc_csv <- doc_csv %>%
mutate( Edad = as.character(Edad),
Edad = map_chr(Edad, corregir),
Edad = as.integer(Edad))
# doc_csv$Edad
#doc_csv <- doc_csv %>%
# mutate( Edad = as.character(Edad),
# Edad = ifelse(Edad == "NO ESPECIFICADO", 999, Edad),
# Edad = as.integer(Edad))
```
```{r}
# Head despliega los primeros datos de la tabla
head(doc_csv)
# Glimpse es similar a head pero los pone transpuesto. Y nos indica la cantidaa de observaciones y de columnas. EL tipo de dato en lass columnas.
glimpse(doc_csv)
# str indica además el tipo de objeto
str(doc_csv)
# Summary
summary(doc_csv)
```
```{r}
doc_csv <- doc_csv %>%
filter(Edad < 200)
# Hist
hist(doc_csv$Edad)
# Calcular la media
mean(doc_csv$Edad)
# median
median(doc_csv$Edad)
# Varianza
var(doc_csv$Edad)
# Desviación estándar
sd(doc_csv$Edad)
```
>En este apartado se destacan algunas funciones de R que se usan en el resto de este documento. Por ejemplo:
sum() proporciona la suma de los elementos del argumento. Así, teniendo en cuenta que x <- (1, 3, 5), sum(x) daría el valor 9.
cumsum() proporciona un vector con la suma acumulada del vector argumento, por ejemplo, cumsum(x) daría [1] 1 4 9
rowSums() y colSums() suman, por filas y por columnas, respectivamente, los datos de una hoja de datos.
prod() y cumprod() son el equivalente a sum() y cumsum() para el producto.
sqrt() es la función raíz cuadrada.
log() es la función logaritmo natural o neperiano.
log10() es el logaritmo en base 10.
exp() es la función exponencial.
max() y min() proporcionan el máximo y el mínimo del argumento (habitualmente, un vector).
sort() proporciona la ordenación de un vector de menor a mayor.
>
# Gráficas básicas
```{r}
# Intento 1
plot(doc_csv$Sexo)
table(doc_csv$Sexo)
# Intento 2
plot(doc_csv$Sexo, main= "Distribución por sexo de desaparecidxs",
ylim= c(0,30000))
# Intento 3
plot(doc_csv$Sexo, main= "Distribución por sexo de desaparecidxs",
ylim= c(0,30000), col= c("red", "blue"))
# Intento 4
plot(doc_csv$Sexo, main= "Distribución por sexo de desaparecidxs",
ylim= c(0,30000), col= c("red", "blue") )
```