ベイズ統計は事象A,Bの条件付き確率から派生した感じ。入門書では条件付き確率からベイズの定理を導いている。そこではP( A ∩ B) ≠ 0 という前提がある。
事象A,Bを用いたベイズの定理の数式から記号をθ,D に変えて一般化していよいよベイズの定理の話が本格化していくのであーーーる。
そこらまでは良い。だが、ベイズの定理の分母の積分をどうするか、という当たりからワタクシの愚脳は理解が滞るのである。
その前に共役分布の話もある。事前分布・事後分布が共役の場合には解析的に計算できる・・・場合がある。ところが現実はそんなにうまくいかない。共役分布が通用する事例は少ない。とエライ人が言うとった。
そこで数値計算だ。MCMC法というものが出てくる。他も出てくるがとりあえずMCMC法だ。これは英語ではモンキーチンパンジーモンキーチンパンジーの略であるわけがない。まぁ難しげな名称なのでワタクシは もしもし法 と呼んでいる。人には言わないからOK牧場。
そして、事後分布をサンプリングするという表現が出てきたのである。これがワタクシの愚脳には理解できない。母集団から標本を取り出すのをサンプリングというのだけどな。もしもし法で事後分布をサンプリングするという意味はどうも何か違うのだ。
そこらがピーーンと来るような理解に達しないのである。
しゃーないのでチャッターズに訊いたりGoogle検索10段(自称)の実力で検索したりしてだな。暇つぶしをしているのである。どや。
だが、わかりやすい解説を見つけたのである。どや。どやどや どーん。パチパチパンチー。
https://blog.deepblue-ts.co.jp/mcmc/mcmc_beginner/
な、誰でもわかるって書いてあるだろ。それがいいのだよ。そこに猫でもわかるとか猿でもわかるとかだとワタクシむかっ腹がたつの。ばかにしてんのか! 分からんワタクシは猫や猿より下ってことかよ コンコンチキ!!
というわけでちょっとだけ紹介。
なるほど そういうわけだったのですね、よく分かりました(ウソ) ワタクシが理解できないのは次の文章である。
解析的に事後分布p(θ∣X)p(θ∣X)を計算せずとも、近似的に事後分布からサンプリングする方法
事後分布がわからないのにどうしてサンプリングできるのだ? そこだで。ま~チャッターズにも訊こうっと。
で、ベイズの定理の数式は左辺=右辺でありました。左辺が事後分布なのですが右辺とは等号で結ばれていまして。するってーと左辺の事後分布は右辺と等しいって事でして。
ならば何らかの方法で右辺を計算すればよくね? って思ったりして。何らかの方法で右辺を計算して値を得る事を近似的に事後分布からサンプリングするって言うとったりして。。。と想像したりして。しかし、それだとサンプリングするというよりは意図的にデータを作っているのではないかと思ったりして。
ま~ワタクシの日本語の読解能力はこんなところだ。
誰でもわかる・・・・・・ぼくにもわかるかな? そりゃどうだろうねえ(笑)