Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
robertopucp
GitHub Repository: robertopucp/1eco35_2022_2
Path: blob/main/Trabajo_grupal/WG6/Grupo_9_r_Pregunta4.R
2714 views
1
#### Grupo 9 #### Pregunta 4 ######
2
3
4
library(haven) # leer archivos stata: dta
5
library(dplyr) # limpieza de datos
6
library(stringr) # grep for regular expression
7
library(srvyr) # libreria para declarar el diseño muestral de una encuesta
8
library(survey)
9
10
11
"Set Directorio"
12
#---------------
13
user <- Sys.getenv("USERNAME") # username
14
15
setwd( paste0("C:/Users/",user,"/Documents/GitHub/1ECO35_2022_2/Grupo9") ) # set directorio
16
17
18
"Load dataset de ENAHO"
19
#----------------------
20
21
enaho34 = data.frame(
22
read_dta("../../enaho/2020/737-Modulo34/737-Modulo34/sumaria-2020.dta")
23
)
24
25
enaho37 = data.frame(
26
read_dta("../../enaho/2020/737-Modulo37/737-Modulo37/enaho01-2020-700.dta")
27
)
28
29
30
"Porcentaje de hogares a nivel departamental (o región) que se beneficia del programa 'juntos'"
31
#-----------------------------------------------------------------------------------------------
32
33
# Mantenemos variables de interés
34
35
enaho_merge_37 <- enaho37[ ,c("conglome", "vivienda", "hogar" ,"ubigeo",
36
"estrato", "p710_04", "factor07")]
37
38
# Diseño muestral de su encuesta
39
40
# Declarar el diseño de la encuesta
41
# ids: conglomerado, strato: estrato y wieght : factor de expansión
42
43
survey_enaho_37 <- enaho_merge_37 %>% as_survey_design(ids = conglome,
44
strata = estrato,
45
weight = factor07)
46
47
48
# Creamos la variables 'ubigeo_dep', 'region'
49
50
enaho_merge_37['ubigeo_dep'] = substr(enaho_merge_37$ubigeo, 1, 2)
51
52
enaho_merge_37 <- enaho_merge_37 %>%
53
mutate(region = case_when(ubigeo_dep == "01" ~ "Amazonas",
54
ubigeo_dep == "02" ~ "Ancash",
55
ubigeo_dep == "03" ~ "Apurimac",
56
ubigeo_dep == "04" ~ "Arequipa",
57
ubigeo_dep == "05" ~ "Ayacucho",
58
ubigeo_dep == "06" ~ "Cajamarca",
59
ubigeo_dep == "07" ~ "Callao",
60
ubigeo_dep == "08" ~ "Cusco",
61
ubigeo_dep == "09" ~ "Huancavelica",
62
ubigeo_dep == "10" ~ "Huanuco",
63
ubigeo_dep == "11" ~ "Ica",
64
ubigeo_dep == "12" ~ "Junin",
65
ubigeo_dep == "13" ~ "La Libertad",
66
ubigeo_dep == "14" ~ "Lambayeque",
67
ubigeo_dep == "15" ~ "Lima",
68
ubigeo_dep == "16" ~ "Loreto",
69
ubigeo_dep == "17" ~ "Madre de Dios",
70
ubigeo_dep == "18" ~ "Moquegua",
71
ubigeo_dep == "19" ~ "Pasco",
72
ubigeo_dep == "20" ~ "Piura",
73
ubigeo_dep == "21" ~ "Puno",
74
ubigeo_dep == "22" ~ "San Martín",
75
ubigeo_dep == "23" ~ "Tacna",
76
ubigeo_dep == "24" ~ "Tumbes",
77
ubigeo_dep == "25" ~ "Ucayali",)
78
)
79
80
81
survey_enaho_37 <- enaho_merge_37 %>% as_survey_design(ids = conglome,
82
strata = estrato,
83
weight = factor07)
84
85
# Creamos el índice 'juntos' que representa el porcentaje de hogares a
86
# nivel departamental (región) que se beneficia del programa
87
88
enaho_37 <- survey_enaho_37 %>% group_by(region) %>%
89
summarise(juntos= survey_mean(p710_04, na.rm = T))
90
91
#Respuesta:
92
View(enaho_37[, c('region', 'juntos')])
93
94
"************************ 2da parte del ejercicio *********************"
95
96
97
"El promedio del porcentaje de gasto en salud realizado por los hogares a nivel de región (o departamentos)"
98
#----------------------------------------------------------------------------------------------------------
99
100
# Mantenemos variables de interés
101
102
enaho_merge_34 <- enaho34[ ,c("conglome", "vivienda", "hogar" ,"ubigeo",
103
"estrato", "gru51hd", "gashog2d", "factor07")]
104
105
106
# Diseño muestral de su encuesta
107
108
# Declarar el diseño de la encuesta
109
# ids: conglomerado, strato: estrato y wieght : factor de expansión
110
111
survey_enaho_34 <- enaho_merge_34 %>% as_survey_design(ids = conglome, strata = estrato,
112
weight = factor07)
113
114
115
# Creamos la variables 'ubigeo_dep', 'region' y la dummy 'p710_04'
116
117
enaho_merge_34['ubigeo_dep'] = substr(enaho_merge_34$ubigeo, 1, 2)
118
enaho_merge_34 <- enaho_merge_34 %>%
119
mutate(region = case_when(ubigeo_dep == "01" ~ "Amazonas",
120
ubigeo_dep == "02" ~ "Ancash",
121
ubigeo_dep == "03" ~ "Apurimac",
122
ubigeo_dep == "04" ~ "Arequipa",
123
ubigeo_dep == "05" ~ "Ayacucho",
124
ubigeo_dep == "06" ~ "Cajamarca",
125
ubigeo_dep == "07" ~ "Callao",
126
ubigeo_dep == "08" ~ "Cusco",
127
ubigeo_dep == "09" ~ "Huancavelica",
128
ubigeo_dep == "10" ~ "Huanuco",
129
ubigeo_dep == "11" ~ "Ica",
130
ubigeo_dep == "12" ~ "Junin",
131
ubigeo_dep == "13" ~ "La Libertad",
132
ubigeo_dep == "14" ~ "Lambayeque",
133
ubigeo_dep == "15" ~ "Lima",
134
ubigeo_dep == "16" ~ "Loreto",
135
ubigeo_dep == "17" ~ "Madre de Dios",
136
ubigeo_dep == "18" ~ "Moquegua",
137
ubigeo_dep == "19" ~ "Pasco",
138
ubigeo_dep == "20" ~ "Piura",
139
ubigeo_dep == "21" ~ "Puno",
140
ubigeo_dep == "22" ~ "San Martín",
141
ubigeo_dep == "23" ~ "Tacna",
142
ubigeo_dep == "24" ~ "Tumbes",
143
ubigeo_dep == "25" ~ "Ucayali",) )
144
145
146
147
survey_enaho_34 <- enaho_merge_34 %>% as_survey_design(ids = conglome, strata = estrato,
148
weight = factor07)
149
150
# Creamos el índice 'promedio_gasto_salud' que representa el porcentaje de hogares a
151
# nivel departamental (o región) que se beneficia del programa
152
153
ind2 <- survey_enaho_34 %>% mutate(
154
porcentaje_gasto_salud = gru51hd/gashog2d
155
) %>% group_by(region) %>% # indicador a nivel regional %>%
156
157
summarise(promedio_gasto_salud= survey_mean(porcentaje_gasto_salud))
158
159
#Respuesta
160
View(ind2[, c('region', 'promedio_gasto_salud')])
161
162