Path: blob/main/Trabajo_grupal/WG5/Grupo_7_py.ipynb
2714 views
Kernel: Python 3 (ipykernel)
Class
In [1]:
In [2]:
In [3]:
In [4]:
Tratando de modificar atributo privado
In [5]:
Out[5]:
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_4952\1245474602.py in <module>
1 # tratando de acceder al atributo privado
----> 2 reg1.__X # no se puede acceder pues esta bloqueado
AttributeError: 'OLSRegClass' object has no attribute '__X'
In [6]:
Out[6]:
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_4952\2535370293.py in <module>
1 # tratando de acceder al atributo privado
----> 2 reg1.X
AttributeError: 'OLSRegClass' object has no attribute 'X'
In [7]:
Out[7]:
0 1.909543
1 1.365773
2 2.540223
3 1.801091
4 3.349904
...
29212 3.978513
29213 3.142265
29214 2.725619
29215 3.142265
29216 2.433613
Name: lnw, Length: 29217, dtype: float64
Tratando de modificar método privado
In [8]:
In [9]:
Out[9]:
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_4952\2232799291.py in <module>
1 # tratando de modificar el metodo bloqueado
----> 2 reg1.finaloutput = new_funtion # no se puede modificar pues el método finaloutput es de solo lectura
AttributeError: 'OLSRegClass' object attribute 'finaloutput' is read-only
SPSS file
In [10]:
In [11]:
Out[11]:
Mostrar las variables que presentan missing values
In [12]:
Out[12]:
year 0
MES 0
CONGLOME 0
VIVIENDA 0
HOGAR 0
CODPERSO 0
UBIGEO 0
DOMINIO 0
ESTRATO 0
P201P 0
P203 0
P203A 22795
P203B 22795
P204 2349
P205 4904
P206 82480
P207 2349
P208A 2349
P208B 84038
P209 19016
dtype: int64
In [13]:
In [14]:
Out[14]:
'Dominio geográfico'
In [15]:
Out[15]:
'Estrato geográfico'
In [16]:
Out[16]:
{1.0: 'Costa Norte',
2.0: 'Costa Centro',
3.0: 'Costa Sur',
4.0: 'Sierra Norte',
5.0: 'Sierra Centro',
6.0: 'Sierra Sur',
7.0: 'Selva',
8.0: 'Lima Metropolitana'}
In [17]:
Out[17]:
{1.0: ' De 500 000 a más habitantes',
2.0: ' De 100 000 a 499 999 habitantes',
3.0: ' De 50 000 a 99 999 habitantes',
4.0: ' De 20 000 a 49 999 habitantes',
5.0: 'De 2 000 a 19 999 habitantes',
6.0: ' De 500 a 1 999 habitantes',
7.0: ' Área de Empadronamiento Rural (AER) Compuesto',
8.0: ' Área de Empadronamiento Rural (AER) Simple'}
Se le pide detectar personas que fueran entrevistadas en ambos años. Para ello, se pide detectar duplicados a partir del identificador por persona : conglome, vivienda, hogar y codperso.
In [18]:
Out[18]:
In [19]:
Out[19]:
Ordene la base de datos a partir de las variables que identifican cada miembro y la variable de año (year). Así podrá observar a cada individuo en ambos años.
In [20]:
Out[20]:
Finalmente crear una base de datos para cada año y guardar en la carpeta data con los siguientes nombres data_2019_(numero de grupo) y data_2020_(numero de grupo).
In [21]: