この中に次の例題がある。
ワタクシはベイズを考えずにDさんが病気である確率を考えた。陽性反応がでたのだから病気に羅漢している確率は 100% である。どーーーや!! まいったか。
まてまて、問題文によると健康な人も3%は陽性反応が出ると書いてある。なのでDさんが陽性反応が出ても羅漢していない可能性もある。うーむ。
するってーと陽性反応が出た人たちの中から間違って陽性反応が出た人たちは除かねばならぬ。
つまり、陽性反応が出た人たちの中で病気であって陽性反応が出た人たちの割合を出せばいいのだな。
このように考えると P(A|B) = となって、陽性反応が出たという状態で病気である確率を計算しませう。
そこでベイズの定理で P(A|B) = P(B|A)・P(A)/P(B) という計算になる。これは陽性になった人の内、病気である人は何割かって割り算ですね。
P(A), P(B|A)は問題で与えられている。そこからP(B)を出すのだ。陽性反応が出た = 健康でも 3% と 羅漢して99% という設定だから何とかP(B)を計算したまえ。
結果は 3.2% になった。
どーや!! と言いたいところだがワタクシは理解出来ぬ。Dさんは陽性反応が出たのだから病気である確率は高いはずだ!! とワタクシの愚脳が申しておりまする。ここ、ここがまったく理解出きぬのである。
陽性反応が出て病気である確率が3.2%であるというのはワタクシの愚脳には通じぬ。もっと高いはずだとワタクシの直感は主張するのである。
ここな。文章理解力がワタクシの愚脳は足りないのだろな。コーヒー飲んで考えることにする。ワタクシの直感は陽性反応が出たのだから感染している、病気である確率は高い!! なのである。
休憩
上の文章を読んで自分で解答を書いているのに気づいた。ワタクシは次のように書いている。
そこでベイズの定理で P(A|B) = P(B|A)・P(A)/P(B) という計算になる。これは陽性になった人の内、病気である人は何割かって割り算ですね。
Dさんが病気に羅漢している確率・・・・この言葉に引っ張られすぎた。
ワタクシは頭痛が60%している、とは言わない。頭痛がするのだから100%頭痛だ。
病気の場合には100万人に一人が罹る難病とか言う。要するに割合だ。
Dさんは病気である何割の人に含まれるか? と考えるとよい。
結果として3.2%と出たが、Dさんは病気である人が3.2%いるうちの一人である、ということになる。陽性になった人の内、病気である人が3.2%であるという意味である。
Dさんが3.2%病気である・・・・というのは意味をなさないのである。
と、ワタクシのIQ88の愚脳は考えて納得しちまった(笑) 確率といっても単なる割合だ。
だが、問題文がなあ。Dさんが病気に羅漢している確率はいくらか? こうなると陽性反応が出たのだから高い確率で羅漢していると直感では捉えるよね。
これは問題文が悪い。そういうことにしとこう。
以上に留意して他のベイズ統計での例題を見る。ほなさいなら