Path: blob/main/Trabajo_grupal/WG5/Grupo_1_r.R
2714 views
#Instalamos el paquete "pacman"1install.packages("pacman")2pacman::p_load(tidyverse, haven, dplyr, janitor , stringr)34#Colocamos el usuario para que pueda correr f�cilmente5user <- Sys.getenv("USERNAME")6#Seteamos el directorio7setwd( paste0("C:/Users/",user,"/Documents/GitHub/1ECO35_2022_2/data"))8#Colocamos la ruta9file_path = "../data/data_administrativa.sav"1011#Para que lea el archivo SPSS12df <- haven::read_sav(file_path , encoding = "UTF-8" )1314#Se muestran las variables del dataframe y abajo si tienen o no missing values15#Aparece True si tiene alg�n valor nulo y False si no tiene ning�n valor nulo16apply(df, MARGIN = 2, function(x) any(is.na(x)))1718#Se muestran las etiquetas de las dos variables P203 y P204:1920#Etiqueta de P20321paste("Etiqueta de variable P203 =", df$P203 %>% attr('label') )# var label22#Etiqueta de P20423paste("Etiqueta de variable P204 =", df$P204 %>% attr('label') )# var label2425#Se muestran las etiquetas de los valores de las dos variables P203 y P204:2627#Etiquetas de los valores de variable P20328df$P203 %>% attr('labels')29#Etiquetas de los valores de la variable P20430df$P204 %>% attr('labels')3132#Hallamos los duplicados con attach33attach(df)3435#Se crea un dataframe con los valores duplicados36df_filtrada <- df %>% group_by(CONGLOME ,VIVIENDA , HOGAR ,CODPERSO) %>%37mutate(duplicates = n()) %>% filter(duplicates >1) %>%3839#Se indica que se muestren las variables del Indicador por Persona y el a�o de cada registro40select(year, CONGLOME ,VIVIENDA , HOGAR ,CODPERSO ,duplicates )4142#Se ordena el nuevo dataframe para que se pueda identificar f�cilmente los registros duplicados y en que a�o se registr� cada uno43df_filtrada <- df_filtrada[order(df_filtrada$CONGLOME, df_filtrada$VIVIENDA, df_filtrada$year),]4445#Mostramos el DataFrame46View(df_filtrada)474849df_filtrada %>% filter(year==2019)-> df_201950df_filtrada %>% filter(year==2020)-> df_20205152write.csv(df_2019, "../data/df_2019")53write.csv(df_2020, "../data/df_2020")545556575859606162636465666768