2014-10-27

ベイズ統計初心者本2冊感想文




史上最強図解 これならわかる!ベイズ統計学 (2012/2)
涌井 良幸 (著), 涌井 貞美 (著)
ナツメ社



図解入門 よくわかる最新ベイズ統計の基本と仕組み (2010/12)
松原望
秀和システム





ベイズ統計初心者本2冊読んでみた
すぐにすたれると思われたベイズ。だけど、微妙なブームが去る様子はまったくない
というわけで、初心者本2冊、さらりと読んでみた

ベイズといえば、統計を勉強し始めて最初のほう、いわばなんとか分布が云々というところでちょっと出てきて以来。練習問題を何題かといてそれっきり。まあ、それは、ベイズ統計というよりも、ベイズの定理だったけど。で、それから、はや十何年。以下、本を読んだ感想

涌井さんの図解最強・・・は、ベイズ統計というよりも、ベイズの定理を、すごく丁寧に説明している。これでわからなかったら、もうどうしようもないと思えるほど。電車の中で立ち読みしながら、暗算で計算方法を追うことができるレベル。かくいう私も、この本の内容を一つ一つ確かめながら読んだら、ベイズの定理が、いったい何者だったのかを、思い出すことができたのであった。ベイジアンネットとか、ベイズ統計学のさわりも、さらりとふれてある。だけど、まあ、かるいご紹介レベルとおもわれる。

松原先生の基本としくみのほうが、やや難しい。最初のほうに、ベイズは簡単ってかいてあったけど、絶対ウソだとおもう。こちらも前半は、ベイズの定理の説明に終始している。だけど、図解最強ほど、懇切丁寧かつ、しつこく解説していない。まあ、かんたんだからこんなんでいいでしょー感が満載か。後半は、ベイズ統計のさわりと応用をさらりと紹介している。事前共役分布(だったか?)をつかうと、かんたんに事後分布を導出できるとか、ベイジアンネットってこう計算するんだよ的な内容が書いてあるけど、淡泊すぎて意味不明。だからといって、マニアックに説明されてもわからないんだけど。まあ、いずれにしても、こんな感じですが、どうでしょう的な内容なわけです

まあ、当たり前といえば、そうなんだけど、この手の本だけで使いこなせるようになるわけでなく、やっぱり、もっと本気度満載なテキストを、それなりにじっくり読んで考える必要はありそうだ。

あと、理論はまあおいておいて、理論を具体例に当てはめた例は、水産系の人たちの話が役に立ちそうな気がする。魚の資源管理の話(どのくらい魚が取れるか?)と、自社顧客の維持(どれくらい買ってくれそうか?カタログの反応率)は、結局同じことだと思うからです。

そうそう、自分が使うとなった時に根本的に疑問なことがある。なにかといえば、STPというかクラスタリングの問題なのです。たいていの場合、わたしは、お客さんがどのクラスターに属するかをいつも考えている。なぜならば、クラスターごとの反応率、言い換えれば尤度は大体わかっているからだ。でも実は、われわれとして一番興味があるのは、どんなクラスターにすると、尤度を最大にできるか?なのだ。その意味で、クラスター定義とは、購買確率に基づいてきめたい。その意味で、クラスター定義は、どっちかといえば、従属変数とか、最適化する相手になる。

だけど、ベイズを使うと、クラスター定義と尤度は所与になる(とおもう)。つまり、とあるお客さんがなにかアクションをしたとき、どのクラスターに属するか?を計算する。だけど、こちらとしては、今のクラスター定義がベターなのかを知りたいのであり、それを置いておいて、どのクラスターに入りそうだといわれても、なんとなくピントがずれている気がしなくもない、と感じるわけです

といったことを、つれずれ考えて読み終わりました。