Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
robertopucp
GitHub Repository: robertopucp/1eco35_2022_2
Path: blob/main/Trabajo_grupal/WG6/Grupo_3_R_Ejercicio1y2.R
2714 views
1
# TAREA 6
2
3
install.packages("fastDummies")
4
5
pacman::p_load(haven,dplyr, stringr, fastDummies)
6
7
user <- Sys.getenv("claud")
8
9
setwd( paste0("D:/PYTHON") )
10
11
#
12
13
14
enaho01_2019 <- read_dta("D:/PYTHON/2019/687-Modulo01/687-Modulo01/enaho01-2019-100.dta")
15
16
enaho01_2020 <- read_dta("D:/PYTHON/2020/737-Modulo01/737-Modulo01/enaho01-2020-100.dta")
17
18
enaho34_2019 <- read_dta("D:/PYTHON/2019/687-Modulo34/687-Modulo34/sumaria-2019.dta")
19
20
enaho34_2020 <- read_dta("D:/PYTHON/2020/737-Modulo34/737-Modulo34/sumaria-2020.dta")
21
22
deflactor_temporal <- read_dta("D:/PYTHON/2020/737-Modulo34/737-Modulo34/ConstVarGasto-Metodologia actualizada/Gasto2020/Bases/deflactores_base2020_new.dta")
23
24
# 1. MERGE DATASET
25
26
enaho_merge2019 <- merge(enaho34_2019, enaho01_2019,
27
by = c("conglome", "vivienda", "hogar"),
28
all.x = T
29
)
30
31
32
enaho_merge2020 <- merge(enaho34_2020, enaho01_2020,
33
by = c("conglome", "vivienda", "hogar"),
34
all.x = T
35
)
36
37
# juntamos las bases 2019 y 2020, y creamos la variable "dpto"
38
# a partir del ubigeo para luego aplicar el merge con deflactor_temporal
39
40
enaho_append <- bind_rows(enaho_merge2019, enaho_merge2020)
41
unique(enaho_append$aÑo)
42
43
44
enaho_append['dpto'] = substr(enaho_append$ubigeo.x, 1, 2)
45
class(enaho_append$dpto)
46
class(deflactor_temporal$dpto)
47
48
enaho_append$dpto <- as.numeric(enaho_append$dpto)
49
class(enaho_append$dpto)
50
51
# merge con deflactor temporal
52
53
enaho_defl <- merge(x = enaho_append, y = deflactor_temporal,
54
by.x = c("dpto", "aÑo.x"),
55
by.y = c("dpto", "aniorec"),
56
all.x = T)
57
58
unique(enaho_defl$aÑo)
59
colnames(enaho_defl)
60
61
# deflactamos las variables ingreso y gasto diviendolas por
62
# mieperho, 12, ld, i00
63
64
# INGRESO
65
enaho_defl['ingreso_perc1'] = enaho_defl$inghog1d / enaho_defl$mieperho
66
enaho_defl['ingreso_perc2'] = enaho_defl$inghog1d / enaho_defl$ld
67
enaho_defl['ingreso_perc3'] = enaho_defl$inghog1d / 12
68
enaho_defl['ingreso_perc4'] = enaho_defl$inghog1d / enaho_defl$i00
69
70
# GASTO
71
enaho_defl['gasto_perc1'] = enaho_defl$gashog2d / enaho_defl$mieperho
72
enaho_defl['gasto_perc2'] = enaho_defl$gashog2d / enaho_defl$ld
73
enaho_defl['gasto_perc3'] = enaho_defl$gashog2d / 12
74
enaho_defl['gasto_perc4'] = enaho_defl$gashog2d / enaho_defl$i00
75
76
77
# 2. SALARIO POR HORA DEL TRABAJADOR DEPENDIENTE
78
79
enaho01_500 <- read_dta("D:/PYTHON/2020/737-Modulo05/737-Modulo05/enaho01a-2020-500.dta")
80
81
# salario anual del primer y segundo empleo
82
83
enaho01_500$ingreso_anual <- enaho01_500$i524e1 + enaho01_500$i538e1
84
85
# cantidad de hrs trabajadas a la semana
86
87
enaho01_500$horas_trab_sem <- enaho01_500$i513t + enaho01_500$i518
88
89
# salario por hora del trabajador dependiente
90
91
enaho01_500$salarioxhora <- enaho01_500$ingreso_anual / (enaho01_500$horas_trab_sem*52)
92
93
# reemplazamos los NA por valores cero
94
95
enaho01_500$salarioxhora[is.na(enaho01_500$salarioxhora)] = 0
96
97
98
# 3. GROUPBY
99
100
# personas con 65 o más años que puedan participar del programa Juntos
101
enaho01_200_2019 <- read_dta("D:/PYTHON/2019/687-Modulo02/687-Modulo02/enaho01-2019-200.dta")
102
enaho01_200_2020 <- read_dta("D:/PYTHON/2020/737-Modulo02/737-Modulo02/enaho01-2020-200.dta")
103
104
enaho_200_append <- append(enaho01_200_2019, enaho01_200_2020)
105
106
enaho_200_append$mayor_65 <- enaho_200_append$p208a >= 65
107
108
109
110
111