Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
robertopucp
GitHub Repository: robertopucp/1eco35_2022_2
Path: blob/main/Trabajo_grupal/WG5/Solucion/script_r.R
2835 views
1
################ Tarea 5 ############################
2
## Curso: Laboratorio de R y Python ###########################
3
## @author: Roberto Mendoza
4
5
6
library(haven)
7
library(stringr)
8
library(dplyr)
9
10
user <- Sys.getenv("USERNAME") # username
11
12
setwd( paste0("C:/Users/",user,"/Documents/GitHub/1ECO35_2022_2/Trabajo_grupal/WG5/Solucion") ) # set directorio
13
14
# Cargamos la base de datos
15
16
file_path = "../../../data/data_administrativa.sav"
17
18
data <- haven::read_sav(file_path , encoding = "UTF-8" ) # read dataset
19
20
21
# Obervamos las etiquetas de variable y valores
22
23
24
data$P209 %>% attr('labels') # value labels
25
data$P209 %>% attr('label') # var label
26
27
data$P206 %>% attr('labels') # value labels
28
data$P206 %>% attr('label') # var label
29
30
31
# detección de duplicados
32
33
data_filtrada <- data %>% group_by(CONGLOME ,VIVIENDA , HOGAR, CODPERSO) %>%
34
mutate(duplicates = n()) %>% filter(duplicates >1)
35
36
# ordenamos segun identificados de prsona y año
37
38
attach(data_filtrada) # cada variables se convierte en objeto independiente
39
40
data1 <- data_filtrada[order(CONGLOME ,VIVIENDA , HOGAR, CODPERSO, year),] # ordenamos
41
42
43
data_2019 <- data1 %>%filter( year == "2019")
44
data_2020 <- data1 %>%filter( year == "2020")
45
46
# guardamos la base de datos
47
48
write_sav(data_2019 , "../../../data/data2019.sav")
49
write_sav(data_2020 , "../../../data/data2020.sav")
50
51
52
53