【学習メモ】因果推論の介入と調整の図形的な解釈
前回の記事の続きです。自分流の理解がかなり混じっているので、あくまで参考程度に。 tokuchie.com
介入を考える際に、条件付き確率を図形解釈すると理解しやすいかなと思ったので、画像を残しておきます。 確率の図形解釈については、以下の書籍を参考にしています。
問題設定
書籍のP3にある、新薬についての調査結果の集計表を用います。
薬投与 | 薬投与無し | |
---|---|---|
男性 | 87人中81人が回復(93%) | 270人中234人が回復(87%) |
女性 | 263人中192人が回復(73%) | 80人中55人が回復(69%) |
合計 | 350人中273人が回復(78%) | 350人中289人が回復(83%) |
以下のグラフィカルモデルは以下になります。Z = 性別 / X = 薬投与有無 / Y = 回復有無となります。 この例ですと、性別(Z)が、X及びY両方に影響を及ぼしています。このようなデータからX->Yの影響を素直に分析しようとしても、Z->X->YのChainでの因果が入ってくるので、単純にはいきません。
こうした場合、Xをある特定の値に固定し、Z->Xの相関を無くしてしまう事で、純粋にX->Yの因果のみを明らかにする事ができます。
このXの値を固定する行為を介入と呼び、親に当たるZの影響を除外する事になるので、Zによる調整、Zのコントロールなどと呼びます。 要は、分析対象のXにインプットとして入ってくる有向線を削除したいという意図で、今回のように親要素(PA)が観測できている時には、Xに介入->PAによる調整というお決まりの形になります。
合わせて、図形も記してありますが、各変数間の従属関係を、"塗り方の歪み"で表現されるのがポイントです。
介入後は、Z->Xの相関が無くなるので、Z内部でのXの塗分けが均一になります。(今回の例ですと、全てのZでXが均一なので分かりにくいですが...)
因果推論については、以下が同値である事を意識しながら、その時々に自分が理解しやすい方法で考えるのがポイントかなと思っています。
- グラフィカルモデルにおいてX->Yで有向線が引かれている
- YをXの関数で表す事ができる
- YとXの相関係数が0ではない (ちなみに検定可)
- XとYには因果がある
- P(X|Y) = P(X)が成り立たない値の組がある
- XとYは従属である
- 図形的にZ毎にXで塗分けた際に、それぞれの面積が異なる
メモ
- グラフで親要素が存在するときは、その要素に調整を加える(つまり、子要素に介入する)事で、子要素 -> 応答変数の因果を分析できる
- PAが観測できていない場合にはバックドア基準により介入対象の変数を特定しますが、理解が進んだら記事にします。
- Latex書くのしんどかったので、数式は飛ばしました。
バックドア基準はこのスライドがとっても分かりやすそう。感謝。
www.slideshare.netスライドの講義verも滋賀大さんがアップロードしてくれていた。大感謝。 www.youtube.com