頻度論 vs. ベイズ統計(後半)

14391223825_3c5732e7af_o

写真:janneke staaks/クリエイティブ・コモンズ表示 2.0 一般

前回のブログではベイズ統計の最大の強みである、結果の解釈が自然で直感的であるというお話をしました。今回はそれに引き続いてベイズ統計の強みと弱みの説明をしたいと思います。

ベイズ統計の強み(2):柔軟性が高い

通常の頻度論の統計では対応することが難しいときでもベイズ統計では対処可能なことがあります(逆にベイズ統計ではできなくて頻度論の統計では解決できる統計の問題はあまりありません)。我々が最も頻繁に用いる回帰分析は頻度論でもベイズ統計でも解析することができるため、回帰分析を例として用います。回帰分析ではβ係数が暴露因子とアウトカムの関連を意味するため、多くの場合、このβ係数を推定することが目的となります。頻度論統計ではデータの数(サンプルサイズ)よりも求めたいβ係数の個数の方が多いと推定できません。例えば、サンプルサイズが100だとすると、一般的に推定できるβ係数の数はその1/10の10前後であると言われています。もちろん、サンプルサイズが100のデータを用いて100個のβ係数を推定することは不可能です。しかしながら、ベイズ統計であれば、β係数の確率分布をこちらで決めることで、「サンプルサイズ<求めたいβ係数の個数」の場合でもβ係数をきちんと推定できるようになります。

その他、複数の異なる研究のデータを統合する場合(メタアナリシスなど)や、アウトカムの出現率が低いデータにロジスティック回帰分析を行う場合などでは、頻度論統計では難しくても、柔軟性が高いベイズ統計なら対処可能です。頻度論統計で何らかの壁にぶつかった時に、ベイズ統計なら解決できることがある、というイメージで良いと思います。

ベイズ統計の弱み(1):モデルが複雑であるため再現性が低い(ブラックボックスになってしまう)

今までベイズ統計の強みをご説明しましたが、ベイズ統計にも弱みがあります。

ベイズ統計の一番の弱みは、モデルが複雑で再現性が低いことだと思います。同じ回帰分析をするのでも、頻度論のモデルであれば統計解析ソフトでシンプルに解析できます。誰がやっても同じデータで同じモデルであれば同じ結果が得られます。論文の信頼性に疑問が出たときには、データとプログラムを送ってもらえば結果を再現することができます(再現性が高い)。そういった意味で、頻度論の解析は「ごまかしがきかない」のです。一方で、ベイズ統計で回帰分析をやると非常に複雑です。回帰分析のβ係数の確率分布などを解析者が決めないといけないので、その仮定(assumption)を変えることで解析結果が変わってしまう可能性があります。例えば、回帰分析を行っていて、β係数が正規分布(図1)だと仮定して暴露因子とアウトカムの関連を評価したところ、p=0.2だったとします。そこで、β係数の分布をベータ分布で試したところ、p=0.03になったとします。そして後者をあたかも当初から予定されていた解析方法かのように報告したとしても、モデルが複雑すぎてチェックすることは困難です。そもそも、そのβ係数の確率分布の仮定自体が正しいかどうかを評価する方法もありません。つまり、実際にどのようなことが行われているのか他の研究者には見えづらくなってしまい、解析のモデルがブラックボックスのようになってしまうことが問題です。ちなみに費用効果分析の時に用いられるモデルでも同様の問題が起こります。

図1:正規分布

正規分布

(出典:Wikipedia

ベイズ統計の弱み(2):事前分布をどのように設定したら良いか分からない

前回のブログでもお書きした通り、ベイズ統計では「事前分布×データ=事後分布」であり、この事後分布が推定値(=我々が知りたいもの)になります。データは客観的なものであり問題ないのですが、事前確率はどこかから取ってこないといけません。頻度論者の中には、「ベイズ統計の事前分布は主観的なものであり、うさんくさい」という考えが根強くありますが、このロジックは間違いです。ベイズ統計では、ほとんど情報を有していない事前分布(無情報事前分布[Non-informative prior]と呼ぶ)を使うことで、主観的な要素はほとんどなくなるからです。この場合には、事後分布はほとんどデータの持っている情報に依存するようになるので、事前分布があまり役割を果たさなくなります。

ただ最近になって、この「主観的なものを入れたくないときには無情報事前分布を使えばよい」という主張も問題があると言っている学者もいます。コロンビア大学のベイズ統計学者であるアンドリュー・ゲルマン教授によると、無情報事前分布を使うことで実際以上に確信的になってしまうため問題であると言っています。(Gelman, 2013)ベイズ統計では事後分布は事前分布とデータとの重みづけ平均(weighted average)になります。事前分布に自信があればあるほど(確率分布の分散が小さくなり)、そちらにより大きな重みを与え、事後分布は事前分布に近いものになります。逆に事前分布に自信が無い場合(分散が大きい)、データにより大きな重みを与え、事後分布はデータから得られた分布に近いものになります。無情報事前分布とは、事前分布に全く自信が無い状態ですので、「無情報事前分布を使うことで実際以上に確信的になってしまう」というのは逆説的に聞こえるかもしれませんが、実際にそのような問題があるのです。ゲルマンの論文では、魅力的な両親から生まれた子供の56%は女児で、普通の両親から生まれた子供の48%が女児であったというデータを使ってこれを説明しています。頻度論の統計で解析すると、魅力的な両親の方が女児が生まれる可能性が高いと言う検定のp値は0.2でした。このデータに、無情報事前分布(一様分布=uniform prior)(図2)を用いてベイズ統計で解析したところ、事後分布では、魅力的な両親の方が女児が生まれやすい確率は90%となりました。ゲルマンはこの数字はあまりに現実的ではなく、P=0.2との乖離があまりに大きいとして、無情報事前分布を使ったことで事後分布に実際以上に「力を与えすぎた」と考えています。ベイズ統計に置いて、無情報事前分布を用いて解析をすること自体に問題があるのかもしれません。

ちなみに、上記のゲルマンの事例ではもっと情報を持った事前分布(informative prior)(例えばθ=0を中心として分散のとても大きい正規分布)を用いれば解決すると思われます。女児が生まれる確率の2群間の差の分布が一様分布であると言う仮説自体が非現実的なくらい極端に無情報である言うことなのでしょう。いずれにしても、そもそも無情報事前分布を使ったら事後分布は頻度論で得られるものとほぼ同じになることが多いことが分かっていますので、そもそもベイズ統計のフレームワークは使わなくて良いと思われます。

図2:一様分布

一様分布

(出典:Wikipedia

頻度論者による「ベイズ統計の事前分布は主観的なものであり、うさんくさい」というロジックは間違いです。主観的であることが嫌なのであれば、無情報事前分布を使えば済むだけです。一方で、無情報事前分布の問題点も最近は指摘されてきているので、ベイズ統計で困ったら無情報事前分布を使うというのシンプルな解決方法にも問題があるようです。

まとめ

ベイズ統計には強みと弱みがそれぞれあります。科学的検証においては再現性があることは非常に重要なので、頻度論の統計で解析できるものであればそちらの方法論を用いるのが良いと個人的には考えています。一方で、頻度論で対処できない問題に直面したときに、ベイズ統計に目を向けることでその障壁を乗り越えることができる可能性があります。いずれにしても、頻度論のベイズ統計のどちらが優れていてどちらが劣っているということではなく、お互いに強みと弱みがあるので、状況に合わせて使い分けることが重要だと考えます。

※当ブログに掲載されている内容の無断転載はご遠慮ください。

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中