【学習メモ】d分離性について、実際の問題を解いて理解する

前回の記事の続き。

tokuchie.com

実際のグラフィカルモデルは、基本3類型には当てはめれないものの、逐次的に1つ1つの伝搬を見ていくと3類型で得た知識を使って、どんな複雑なモデルでも、従属性が存在するかどうか?を確かめる事ができる。というお話。

冷静に見ていくと、そこまで複雑では無いので、実際の例題を解いてみながら、d分離性についての理解を深めます!

www.amazon.co.jp

概念マップ

f:id:osapii:20200622163905p:plain

drive.google.com

d分離性とは?

とりあえず、書籍に記載してある定義を少し、わかりやすくして書きます。

(d分離) XがノードXとYの間の全ての道をブロックする時、Zが与えられた下でXとYはd分離されている。すなわちZが与えられた下でXとYは条件付き独立である。

そして、道pがノードの集合Zによりブロックされている事は以下と同値である。

  1. pは連鎖A->B->Cまたは、分岐A <- B -> Cを含み、Bが条件付けされている
  2. pは合流 A->B<-Cを含み、Bが条件付けされていない。さらにいかなるBの子孫も条件付けされていない。

何やら一見複雑そうですが、重要な点は以下です。 1. 条件付けされているかいないかで、従属性が流れるかどうかが変わる 2. 全ての道を確認し、1つの道であっても従属性が流れるならばその場合はd連結

上記の定義に従って、2つのノード間がd分離であるかどうかを確かめるには、3類型で確認した規則を、逐次的に経路に対して適用することになります。

具体的な例題1

実際の問題を解いてみます。

f:id:osapii:20200622164923p:plain 今回はこのようなグラフィカルモデルを題材に、ZとYがd分離であるかどうかを考えていきます。 Wには、特に何も条件を課していないことに注意します。 f:id:osapii:20200622164937p:plain まずは、ZとYの間に存在する経路を全て洗い出します。今回の例題ですと、Z->W->X->Yが唯一の経路となるので、この途中でブロックされるかどうかを逐次的に確認していきます。 f:id:osapii:20200622165222p:plain まずは、紫の円で囲まれた部分の伝搬を見ていきます。ここで、前回の記事で取り扱っている、合流点の形をしていますが、この時ZとXは独立となるので、Z->X間で従属性は流れません。

d分離の定義に戻ると、2に当てはまるのでブロックされている事になります。この時点で、ZとYがd分離である事が分かります。(色々な言い換えをすると、ZとYは独立 / ZとYの相関係数の絶対値は0に近い / ZとYは全く関係ないよと言う事です。)

具体的な例題

さて、同じグラフィカルモデルですが、今度はWに条件を課してみます。つまり、"Wが〇〇になる"と分かっている状況下において、ZとYに従属性が認められるか?を考えていきます。 f:id:osapii:20200622165713p:plain 今回は、条件付けされているので、Wを赤い点で示しています。 f:id:osapii:20200622165723p:plain 伝搬のステップは、先ほどの例題と同じですが、条件付けによって、従属性の流れが変わってきます。

f:id:osapii:20200622165733p:plain この時、Z->Xは従属の関係があるので、従属性が流れる事になります。(画像中では太い黒矢印で示しています。) Wが判明しているという状況下では、Zを知る事で、Xの値がある程度分かる。つまり従属性が認められます。具体的な例は以下です。

*1

f:id:osapii:20200622165745p:plain 次のステップに進みます。(オレンジの円) ここは単純に因果の関係が認められるので、従属性が流れます。 これで、Z->W->X->Yがブロックされる事なく繋がり、ZとYがd連結している事が分かりました。

メモ

  • 従属性が流れる部分は、ニューラルネットの逆伝搬と近いものがあって共通点を感じられた。同じように連鎖率を使う事で、ZがYに与える影響なんかも定量的に把握できるようになっているのだと思う。今後出てきそう。
  • d分離性の概念を用いる事で、グラフィカルモデルが与えられた時に、変数間の独立性を判断する事ができる。
  • ただし、重要なのはそのグラフィカルモデルが正しいかどうか?なので、その辺りの検証方法はこの先に出てくる、多分。

*1:音楽の成績がずば抜けて成績が優秀である(X) OR 運動の成績がずば抜けて成績が優秀である(Y)場合に、奨学金が与えられる(Z)とする。 この時、Zを観測する前であれば、ある学生が音楽の成績が良くても、運動の成績を推測する要素にはならない。(周辺独立が成立している)

一方で、奨学金を受け取ったという事象を観測した際には、音楽の成績が低い(X) -> 運動の成績がずば抜けて優秀(Y)などというように、Xを知る事で、Yの値を当てることが出来る。つまり、Zの下で、XとYは条件付き従属である。