Path: blob/master/site/es-419/probability/examples/Eight_Schools.ipynb
25118 views
Copyright 2018 The TensorFlow Probability Authors.
Licensed under the Apache License, Version 2.0 (the "License");
El problema de las ocho escuelas (Rubin 1981) considera la efectividad de los programas de entrenamiento del SAT realizados en paralelo en ocho escuelas. Se ha convertido en un problema clásico (Análisis de datos bayesianos, Stan) que ilustra la utilidad del modelado jerárquico para compartir información entre grupos intercambiables.
La implementación que se muestra a continuación es una adaptación de un tutorial de Edward 1.0.
Importaciones
Los datos
Del análisis de datos bayesiano, sección 5.5 (Gelman et al. 2013):
Se realizó un estudio para el Educational Testing Service con el fin de analizar los efectos de los programas especiales de preparación para el SAT-V (Scholastic Aptitude Test-Verbal) en cada uno de las ocho escuelas secundarias. La variable de resultado en cada estudio fue la puntuación obtenida en una administración especial del SAT-V, del SAT-V, un examen estandarizado de opción múltiple administrado por el Educational Testing Service y uusado para ayudar a las universidades a tomar decisiones de admisión; las puntuaciones pueden variar entre 200 y 800, con una media de aproximadamente 500 y una desviación estándar de aproximadamente 100. Los exámenes SAT están diseñados para que sean resistentes a los esfuerzos a corto plazo dirigidos específicamente a mejorar el rendimiento en la prueba; en su lugar, están diseñados para reflejar los conocimientos adquiridos y las capacidades desarrolladas a lo largo de muchos años de educación. Sin embargo, cada una de las ocho escuelas en este estudio consideró que su programa de entrenamiento a corto plazo fue muy exitoso en el aumento de los puntajes del SAT. Además, no había ninguna razón previa para creer que alguno de los ocho programas fuera más efectivo que cualquier otro o que algunos tuvieran efectos más similares entre sí que con cualquier otro.
Para cada una de las ocho escuelas (), tenemos un efecto de tratamiento estimado y un error estándar de la estimación del efecto . Los efectos del tratamiento en el estudio se obtuvieron mediante una regresión lineal en el grupo de tratamiento utilizando las puntuaciones PSAT-M y PSAT-V como variables de control. Como no había ninguna creencia previa de que alguna de las escuelas fuera más o menos similar o que alguno de los programas de entrenamiento fuera más efectivo, podemos considerar los efectos del tratamiento como intercambiables.
Modelo
Para capturar los datos, usamos un modelo normal jerárquico. Sigue el proceso generativo,
donde representa el efecto promedio del tratamiento anterior y controla cuánta variación hay entre escuelas. Se observan y . Como , el modelo se acerca al modelo sin agrupación, es decir, se permite que cada una de las estimaciones del efecto del tratamiento escolar sea más independiente. Como , el modelo se aproxima al modelo de agrupación completa, es decir, todos los efectos del tratamiento escolar están más cerca del promedio del grupo . Para restringir la desviación estándar para que sea positiva, extraemos de una distribución lognormal (lo que equivale a extraer de una distribución normal).
De acuerdo con el Diagnóstico de inferencia sesgada con divergencias, transformamos el modelo anterior en un modelo no centrado equivalente:
Cosificamos este modelo como una instancia JointDistributionSequential:
Inferencia bayesiana
A partir de los datos, aplicamos el algoritmo hamiltoniano de Monte Carlo (HMC) para calcular la distribución posterior sobre los parámetros del modelo.
Podemos observar la reducción hacia el grupo avg_effect
anterior.
Crítica
Para obtener la distribución predictiva posterior, es decir, un modelo de nuevos datos a partir de los datos observados :
anulamos los valores de las variables aleatorias en el modelo para establecerlos en la media de la distribución posterior y tomamos muestras de ese modelo para generar nuevos datos .
Podemos observar los residuos entre los datos de los efectos del tratamiento y las predicciones de la posterior del modelo. Estos se corresponden con el gráfico anterior que muestra la contracción de los efectos estimados hacia el promedio de la población.
Como tenemos una distribución de predicciones para cada escuela, también podemos considerar la distribución de residuos.
Agradecimientos
Este tutorial fue escrito originalmente en Edward 1.0 (fuente). Agradecemos a todos los contribuyentes por escribir y revisar esa versión.
Referencias
Donald B. Rubin. Estimación en experimentos aleatorios paralelos. Revista de Estadísticas Educativas, 6(4):377-401, 1981.
Andrew Gelman, John Carlin, Hal Stern, David Dunson, Aki Vehtari y Donald Rubin. Análisis de datos bayesianos, tercera edición. Chapman y Hall/CRC, 2013.