Path: blob/main/Trabajo_grupal/WG6/Grupo_3_R_Ejercicio1y2.R
2714 views
# TAREA 612install.packages("fastDummies")34pacman::p_load(haven,dplyr, stringr, fastDummies)56user <- Sys.getenv("claud")78setwd( paste0("D:/PYTHON") )910#111213enaho01_2019 <- read_dta("D:/PYTHON/2019/687-Modulo01/687-Modulo01/enaho01-2019-100.dta")1415enaho01_2020 <- read_dta("D:/PYTHON/2020/737-Modulo01/737-Modulo01/enaho01-2020-100.dta")1617enaho34_2019 <- read_dta("D:/PYTHON/2019/687-Modulo34/687-Modulo34/sumaria-2019.dta")1819enaho34_2020 <- read_dta("D:/PYTHON/2020/737-Modulo34/737-Modulo34/sumaria-2020.dta")2021deflactor_temporal <- read_dta("D:/PYTHON/2020/737-Modulo34/737-Modulo34/ConstVarGasto-Metodologia actualizada/Gasto2020/Bases/deflactores_base2020_new.dta")2223# 1. MERGE DATASET2425enaho_merge2019 <- merge(enaho34_2019, enaho01_2019,26by = c("conglome", "vivienda", "hogar"),27all.x = T28)293031enaho_merge2020 <- merge(enaho34_2020, enaho01_2020,32by = c("conglome", "vivienda", "hogar"),33all.x = T34)3536# juntamos las bases 2019 y 2020, y creamos la variable "dpto"37# a partir del ubigeo para luego aplicar el merge con deflactor_temporal3839enaho_append <- bind_rows(enaho_merge2019, enaho_merge2020)40unique(enaho_append$aÑo)414243enaho_append['dpto'] = substr(enaho_append$ubigeo.x, 1, 2)44class(enaho_append$dpto)45class(deflactor_temporal$dpto)4647enaho_append$dpto <- as.numeric(enaho_append$dpto)48class(enaho_append$dpto)4950# merge con deflactor temporal5152enaho_defl <- merge(x = enaho_append, y = deflactor_temporal,53by.x = c("dpto", "aÑo.x"),54by.y = c("dpto", "aniorec"),55all.x = T)5657unique(enaho_defl$aÑo)58colnames(enaho_defl)5960# deflactamos las variables ingreso y gasto diviendolas por61# mieperho, 12, ld, i006263# INGRESO64enaho_defl['ingreso_perc1'] = enaho_defl$inghog1d / enaho_defl$mieperho65enaho_defl['ingreso_perc2'] = enaho_defl$inghog1d / enaho_defl$ld66enaho_defl['ingreso_perc3'] = enaho_defl$inghog1d / 1267enaho_defl['ingreso_perc4'] = enaho_defl$inghog1d / enaho_defl$i006869# GASTO70enaho_defl['gasto_perc1'] = enaho_defl$gashog2d / enaho_defl$mieperho71enaho_defl['gasto_perc2'] = enaho_defl$gashog2d / enaho_defl$ld72enaho_defl['gasto_perc3'] = enaho_defl$gashog2d / 1273enaho_defl['gasto_perc4'] = enaho_defl$gashog2d / enaho_defl$i00747576# 2. SALARIO POR HORA DEL TRABAJADOR DEPENDIENTE7778enaho01_500 <- read_dta("D:/PYTHON/2020/737-Modulo05/737-Modulo05/enaho01a-2020-500.dta")7980# salario anual del primer y segundo empleo8182enaho01_500$ingreso_anual <- enaho01_500$i524e1 + enaho01_500$i538e18384# cantidad de hrs trabajadas a la semana8586enaho01_500$horas_trab_sem <- enaho01_500$i513t + enaho01_500$i5188788# salario por hora del trabajador dependiente8990enaho01_500$salarioxhora <- enaho01_500$ingreso_anual / (enaho01_500$horas_trab_sem*52)9192# reemplazamos los NA por valores cero9394enaho01_500$salarioxhora[is.na(enaho01_500$salarioxhora)] = 0959697# 3. GROUPBY9899# personas con 65 o más años que puedan participar del programa Juntos100enaho01_200_2019 <- read_dta("D:/PYTHON/2019/687-Modulo02/687-Modulo02/enaho01-2019-200.dta")101enaho01_200_2020 <- read_dta("D:/PYTHON/2020/737-Modulo02/737-Modulo02/enaho01-2020-200.dta")102103enaho_200_append <- append(enaho01_200_2019, enaho01_200_2020)104105enaho_200_append$mayor_65 <- enaho_200_append$p208a >= 65106107108109110111