Path: blob/main/Trabajo_grupal/WG5/Solucion/script_r.R
2835 views
################ Tarea 5 ############################1## Curso: Laboratorio de R y Python ###########################2## @author: Roberto Mendoza345library(haven)6library(stringr)7library(dplyr)89user <- Sys.getenv("USERNAME") # username1011setwd( paste0("C:/Users/",user,"/Documents/GitHub/1ECO35_2022_2/Trabajo_grupal/WG5/Solucion") ) # set directorio1213# Cargamos la base de datos1415file_path = "../../../data/data_administrativa.sav"1617data <- haven::read_sav(file_path , encoding = "UTF-8" ) # read dataset181920# Obervamos las etiquetas de variable y valores212223data$P209 %>% attr('labels') # value labels24data$P209 %>% attr('label') # var label2526data$P206 %>% attr('labels') # value labels27data$P206 %>% attr('label') # var label282930# detección de duplicados3132data_filtrada <- data %>% group_by(CONGLOME ,VIVIENDA , HOGAR, CODPERSO) %>%33mutate(duplicates = n()) %>% filter(duplicates >1)3435# ordenamos segun identificados de prsona y año3637attach(data_filtrada) # cada variables se convierte en objeto independiente3839data1 <- data_filtrada[order(CONGLOME ,VIVIENDA , HOGAR, CODPERSO, year),] # ordenamos404142data_2019 <- data1 %>%filter( year == "2019")43data_2020 <- data1 %>%filter( year == "2020")4445# guardamos la base de datos4647write_sav(data_2019 , "../../../data/data2019.sav")48write_sav(data_2020 , "../../../data/data2020.sav")4950515253