Path: blob/master/site/ja/probability/examples/Eight_Schools.ipynb
25118 views
Copyright 2018 The TensorFlow Probability Authors.
Licensed under the Apache License, Version 2.0 (the "License");
Eight Schools の問題
Eight Schools の問題(Rubin 1981)は、8 つの高校で同時に実施された SAT 指導プログラムの有効性を考察する問題です。交換可能なグループ間で情報を共有する階層モデルの有用性を説明する古典的な問題(Bayesian Data Analysis, Stan)になっています。
以下の実装は Edward 1.0 のチュートリアルを調整し直したものです。
インポート
データ
『Bayesian Data Analysis』第 5.5 項(Gelman et al. 2013)の抄訳:
8 つの高校で実施された SAT-V(Scholastic Aptitude Test-Verbal)特別指導プログラムの効果を分析するために、Educational Testing Service の調査が実施されました。各調査の結果変数は、SAT-V の特別実施のスコアでした。これは、Educational Testing Service が運営し、大学が入学決定を下す際に使用する標準化された多肢選択式テストです。スコアは 200 点から 800 点の間で変動し、平均は約 500 点、標準偏差は約 100 点です。SAT 試験は、特に試験の成績を上げるための短期的な取り組みを評価するものではなく、長期にわたる学習で得た知識と能力の開発を反映するように設計されています。それにもかかわらず、この調査の対象となった 8 つの高校では、その短期指導プログラムが SAT のスコアの引き上げに非常に役立つと考えました。また、8 つのプログラムのいずれも、他のプログラムよりも効果的であったり、いくつかのプログラムの効果の類似性が他のプログラムのものよりも高かったりすることを予め信じる理由はありませんでした。
8 つの各高校()について、推定処置効果 と効果推定の標準誤差 があります。調査の処置効果は、PSAT-M と PSAT-V スコアを制御変数として使用し、処置グループの線形回帰によって取得されました。いずれの高校も類似性がある、またはいずれかの指導プログラムの効果がより高いという考えが前もってなかったため、処置効果を交換可能と捉えることができます。
モデル
データを取得するために、階層正規モデルを使用します。これは次の生成プロセスに従います。
上記の は、事前の平均処置効果を表し、 は、高校間でどれくらいのバリアンスがあるかを制御します。 と は観測済みです。 である場合、モデルは非プーリングモデルに近づきます。つまり、各高校の処理効果の推定は、より独立した推定になれるということです。 である場合、モデルは完全なプーリングモデルに近づきます。つまり、すべての高校の処置効果は、集団平均 により近づきます。標準偏差が正にならないように、対数正規分布から をドローします(正規分布から をドローすることに相当します)。
「Diagnosing Biased Inference with Divergences」に従って、上記のモデルを同等の非中心モデルに変換します。
このモデルを JointDistributionSequential インスタンスとして具体化します。
ベイズ推論
特定のデータで、ハミルトニアンモンテカルロ(HMC)を実行して、モデルのパラメータで事後確率分布を計算します。
上記の集団 avg_effect
への縮小が見られます。
批評
事後確率予測分布、つまり特定の観測データ である場合に新しいデータ のモデルを取得するには、次のようにします。
モデルのランダム変数の値をオーバーライドして、事後確率分布の平均に設定し、そのモデルからサンプリングして新しいデータ を生成します。
処置効果データとモデルの事後確率予測の間にある残差を見ることができます。これらは、母集団の平均に対する推定効果の縮小を示す上記のプロットに対応しています。
各高校の予測の分布があるため、残差の分布も検討することができます。
謝辞
このチュートリアルは Edward 1.0(出典)に掲載されていたものです。そのバージョンの作成と改訂に貢献されたすべての方に感謝します。
参考資料
Donald B. Rubin. Estimation in parallel randomized experiments. Journal of Educational Statistics, 6(4):377-401, 1981.
Andrew Gelman, John Carlin, Hal Stern, David Dunson, Aki Vehtari, and Donald Rubin. Bayesian Data Analysis, Third Edition. Chapman and Hall/CRC, 2013.