Path: blob/master/site/pt-br/probability/examples/Eight_Schools.ipynb
25118 views
Copyright 2018 The TensorFlow Probability Authors.
Licensed under the Apache License, Version 2.0 (the "License");
O problema das oito escolas (Rubin 1981) considera a eficácia dos programas de treinamento do equivalente ao vestibular dos Estados Unidos (SAT) em paralelo em oito escolas. É um problema clássico (Bayesian Data Analysis, Stan) que ilustra a utilidade de modelagem hierárquica para compartilhamento de informações entre grupos intercambiáveis.
A implementação abaixo é uma adaptação de um tutorial em Edward 1.0.
Importações
Os dados
Da seção 5.5 de Bayesian Data Analysis (Análise bayesiana de dados, Gelman et al. 2013, em tradução livre):
Um estudo foi realizado pelo Educational Testing Service (Serviço de Testes Educacionais) para analisar os efeitos dos programas de treinamento especiais para SAT-V (Scholastic Aptitude Test-Verbal – Teste de Aptidão Escolar - Verbal) em cada uma das oito escolas. A variável resultante em cada estudo foi a nota em uma aplicação especial do SAT-V, um teste de múltipla escolha padronizado aplicado pelo Educational Testing Service e usado para ajudar as faculdades a tomar decisões de admissão. As notas variam de 200 e 800, com média de 500 e desvio padrão de 100. As provas do SAT são resistentes aos efeitos de curto prazo para aumentar o desempenho no teste e foram projetadas para refletir os conhecimentos adquiridos e as habilidades desenvolvidas ao longo de muitos anos de educação. Todavia, cada uma das oito escolas neste estudo consideraram que seu programa de treinamento de curto prazo teve grande sucesso no aumento das notas do SAT. Além disso, não havia motivo anterior para acreditar que qualquer um dos oito programas era mais eficaz que o outro ou que alguns tinham efeito mais similar entre si do que com qualquer outro.
Para cada uma das oito escolas (), temos um efeito de tratamento estimado e um erro padrão da estimativa de efeito . Os efeitos de tratamento no estudo foram obtidos por meio de uma regressão linear do grupo de tratamento usando as notas PSAT-M e PSAT-V como variáveis de controle. Como não havia motivo anterior para acreditar que qualquer uma das escolas fosse mais ou menos similar ou que qualquer um dos programas de treinamento fosse mais eficaz, podemos considerar que os efeitos de tratamento são intercambiáveis.
Modelo
Para capturar os dados, usamos um modelo normal hierárquico, que segue o processo generativo
em que representa o efeito de tratamento médio anterior, e controla quanta variância existe entre as escolas. e são observados. À medida que , o modelo se aproxima do modelo sem pooling, ou seja, as estimativas de efeito de tratamento de cada escola podem ser mais independentes. À medida que , o modelo se aproxima do modelo com pooling completo, ou seja, os efeitos de tratamento de todas as escolas estão mais próximos da média do grupo . Para restringir que o desvio padrão seja positivo, obtemos de uma distribuição log-normal (que é equivalente a obter de uma distribuição normal).
Seguindo o artigo Diagnosing Biased Inference with Divergences (Diagnóstico de inferência com bias e divergências), transformamos o modelo acima em um modelo não centralizado equivalente:
Nós materializamos esse modelo como uma instância de JointDistributionSequential:
Inferência bayesiana
Com os dados colhidos, fazemos o Monte Carlo Hamiltoniano (HMC) para calcular a distribuição posterior para os parâmetros do modelo.
Podemos observar o encolhimento em direção ao efeito médio avg_effect
do grupo acima.
Crítica
Para obter a distribuição preditiva anterior, isto é, um modelo de novos dados usando os dados observados :
sobrescrevemos os valores das variáveis aleatórias no modelo, definindo-as como a média da distribuição posterior, e fazemos a amostragem desse modelo para gerar os novos dados .
Podemos conferir os restos entre os dados de efeito de tratamento e as previsões do modelo posterior, que correspondem ao gráfico acima, mostrando o encolhimento dos efeitos estimados rumo à média da população.
Como temos uma distribuição de previsões para cada escola, também podemos considerar a distribuição dos restos.
Agradecimentos
Este tutorial foi escrito originalmente em Edward 1.0 (fonte). Agradecemos a todos os contribuidores por escreverem e revisarem essa versão.
Referências
Donald B. Rubin. Estimation in parallel randomized experiments (Estimativa em experimentos randomizados paralelos). Journal of Educational Statistics, 6(4):377-401, 1981.
Andrew Gelman, John Carlin, Hal Stern, David Dunson, Aki Vehtari, and Donald Rubin. Bayesian Data Analysis (Análise bayesiana de dados), Terceira edição. Chapman e Hall/CRC, 2013.