Path: blob/main/Trabajo_grupal/WG6/Grupo_5_r.R
2714 views
library(haven) # leer archivos spss, stata, dbf, etc1library(dplyr) # limpieza de datos2library(stringr) # grep for regular expression3library(fastDummies) # crear dummy4library(srvyr) # libreria para declarar el dise�o muestral de una encuesta5library(survey)67user <- Sys.getenv("fdcc0")89setwd( paste0("C:/Users/{user}/Documentos/GitHub/1ECO35_2022_2/lab7") )1011121314#Pregunta 115# Establecemos las bases que usaremos enaho01_19 y enaho34_191617enaho01_2019 <- read_dta("../../../datos/2019/687-Modulo01/687-Modulo01/enaho01-2019-100.dta")1819enaho34_2019 <- read_dta("../../../datos/2020/737-Modulo01/737-Modulo01/enaho01-2020-100.dta")2021#Establecemos las bases que usaremos enaho01_20y enaho34_202223enaho01_2020 <- read_dta("../../../datos/2020/737-Modulo01/737-Modulo01/enaho01-2020-100.dta")2425enaho34_2020 <- read_dta("../../../datos/2020/737-Modulo34/737-Modulo34/sumaria-2020.dta")2627# Establecemos la base de los deflactores2829deflactor_temporal <- read_dta("../../../datos/2020/737-Modulo34/737-Modulo34/ConstVarGasto-Metodologia actualizada/Gasto2020/Bases/deflactores_base2020_new.dta")3031# Hacemos el merge entre ambas3233enaho_merge2019 <- merge(enaho34_2019, enaho01_2019,34by = c("conglome", "vivienda", "hogar"),35all.x = T36)373839enaho_merge2020 <- merge(enaho34_2020, enaho01_2020,40by = c("conglome", "vivienda", "hogar"),41all.x = T42)4344# Ahora, vamos a realizar el append45enaho_append <- append(enaho_merge2019, enaho_merge2020)4647#Creamose el ingreso real mensual48#Creamose el gasto real menusal49enaho_append$ingreso_mensual <- enaho_append$inghog1d / (12*enaho_append$mieperho)5051enaho_append$gasto_mensual <- enaho_append$gashog2d / (12*enaho_append$mieperho)5253# deflactando las variables (deflactor espacial y temporal)5455# espacial56enaho_append$ingreso_mensual_defl <- enaho_append$ingreso_mensual * enaho_append$ld5758enaho_append$gasto_mensual_defl <- enaho_append$gasto_mensual * enaho_append$ld59606162636465#Pregunta 266#el salario por hora del trabajador dependiente6768enaho01_500 <- read_dta("../../../2020/737-Modulo05/737-Modulo05/enaho01a-2020-500.dta")6970# Obtenemos el salario anual del primer y segundo empleo7172enaho01_500$ingreso_anual <- enaho01_500$i524e1 + enaho01_500$i538e17374# Encontramos el n�mero de hrs trabajadas en la semana7576enaho01_500$horas_trab_sem <- enaho01_500$i513t + enaho01_500$i5187778# Encontramos el salario x hora del trabajador7980enaho01_500$salarioxhora <- enaho01_500$ingreso_anual / (enaho01_500$horas_trab_sem*52)8182# reemplazamos los Na por valores 08384enaho01_500$salarioxhora[is.na(enaho01_500$salarioxhora)] = 0858687#Pregunta 388enaho02 <- read_dta("../../../enaho/2020/737-Modulo02/enaho01-2020-200.dta")899091base1 <- enaho02%>% group_by(conglome, vivienda, hogar ) %>% summarise(edad_max = max(p208a))9293enaho34 <- read_dta("../../../enaho/2020/737-Modulo34/sumaria-2020.dta")9495#Hacemos el merge9697num = list(enaho34)98merge1 = enaho0299100for (i in num){101102merge1 <- merge(merge1, i,103by = c("conglome", "vivienda", "hogar"),104all.x = T, suffixes = c("",".y")105)106}107108names(merge1)109110#Creamos la variable dummy111pension <- merge1 %>%mutate(g1 = ifelse(edad_max <=65,1,0))112113