Path: blob/main/Trabajo_grupal/WG6/Grupo_6_py.py
2714 views
# -*- coding: utf-8 -*-1"""2Created on Sun Oct 30 09:55:19 202234@author: oa_da5"""67#!pip install weightedcalcs89import pandas as pd10import numpy as np11import chardet # to get string character format12import re # for regular expression13import os # for usernanme y set direcotrio1415# Comenzamos cargando el dataset 20191617user = os.getlogin() # Username18os.chdir(f"C:/Users/{user}/Documents/GitHub/1ECO35_2022_2/Trabajo_grupal/WG6")1920enaho2019= pd.read_stata(("../../enaho/2019/687-Modulo01/687-Modulo01/enaho01-2019-100.dta"))21sumaria2019= pd.read_stata(("../../enaho/2019/687-Modulo01/687-Modulo34/sumaria-2019.dta"))2223# se realiza el merge entre ambas modulos para el año 20192425enaho_2019 = pd.merge(enaho2019, sumaria2019,26on = ["conglome", "vivienda", "hogar"],27how = "left",28suffixes=('', '_y')) #se determinan los sufijos2930#se filtran por ciertas variables31enaho_2019 = enaho_2019[["conglome", "vivienda", "hogar" ,"ubigeo",32"aÑo" , "mieperho", "inghog1d",33"gashog2d", "ld"]]343536#Ahora, se carga el dataset 20203738enaho2020= pd.read_stata(("../../enaho/2020/737-Modulo01/737-Modulo01/enaho01-2020-100.dta"))39sumaria2020= pd.read_stata(("../../enaho/2020/737-Modulo01/737-Modulo34/sumaria-2020.dta"))4041# se realiza el merge entre ambas modulos para el año 20204243enaho_2020 = pd.merge(enaho2020, sumaria2020,44on = ["conglome", "vivienda", "hogar"],45how = "left",46suffixes=('', '_y')) #se determinan los sufijos4748#nuevamente se procede a filtrar según las variables indicadas4950enaho_2020 = enaho_2020[["conglome", "vivienda", "hogar" ,"ubigeo",51"aÑo" , "mieperho", "inghog1d",52"gashog2d", "ld"]]5354#una vez juntadas las bases de datos para cada año se realizará el append5556merge_append = enaho_2020.append(enaho_2019,57ignore_index = True)58merge_append5960#se deflactaran las variables de manera espacial y temporal61#primero se llamará la base de datos de deflactores con año base 20206263deflactores_base2020_new = pd.read_stata(r"../../../../enaho/2020/737-Modulo34/737-Modulo34/ConstVarGasto-Metodologia actualizada/Gasto2020/Bases/deflactores_base2020_new.dta",64convert_categoricals=False)6566#6768merge_append_deflac = pd.merge(merge_append, deflactores_base2020_new,69on = ["dpto", "aNo"],70how = "left",71validate = "m:1")72737475767778