Path: blob/main/Trabajo_grupal/WG8/Grupo_9 (2).ipynb
2714 views
Kernel: Python 3 (ipykernel)
In [1]:
Out[1]:
In [2]:
In [3]:
Out[3]:
1. En gráfico muestre el histograma de frecuencias absolutas del salario y , en otro gráfico, el histograma del logaritmo del salario. Comente las diferencias y por qué.
In [4]:
Out[4]:
Text(0.04, 0.02, 'Elaboración en base al RData')
In [5]:
Out[5]:
Text(0.04, 0.02, 'Elaboración en base al RData')
Se cambia la variable a logaritmo ya que se trata de escoger una transformación que conduzca a una distribución simétrica, y más cercana a la normal. Para distribuciones asimétricas positivas (frecuencias altas hacia el lado izquierdo de la distribución), se suele usar el logaritmo, pues comprime los valores altos y expande los pequeños. Tal sería el caso del primer gráfico, ya que claramente se observa una asimetría asimétrica positiva más fuerte porque existen valores que se distancian considerablemente de la media del salario así como también la transformación reduce los valores altos de la frecuencia en el primer caso.
2. En una sola imagen, el gráfico de densidad del logaritmo del salario por hora de las mujeres que terminaron la universidad y el caso de los hombres.
In [6]:
In [7]:
Out[7]:
Text(0.5, 0, 'lwage by sex')
3. En un gráfico Pie, muestre el porcentaje de personas según nivel educativo.
In [8]:
In [9]:
Out[9]:
In [10]:
Out[10]:
4. En un gráfico, muestre el diagrama de cajas (box - plot) del logaritmo del salario por hora de las personas con el mayor nivel educativo (ad) según genero.
Nótese que el gráfico debe contener dos box-plot uno para los hombres y otro para las mujeres
In [11]:
Out[11]:
In [12]:
Out[12]:
[Text(0, 0, 'Hombre'), Text(1, 0, 'Mujer')]
In [ ]: