2つの事柄が原因と結果の関係にあるのか、ないのかを識別する方法を「因果推論」と呼びます。たとえビッグデータがあっても、正しい因果推論の手法で解析しなければ、そこから意味のある情報を得ることができません。因果関係と相関関係を取り違えてしまい、その結果を信じて政策立案すると、想定した結果が得られません。これは税金の無駄遣いになるだけでなく、それに関わる人たちの生活にとって悪影響が出てしまう可能性まであります。
これから数回にわたって統計データや研究結果の読み方に関してご説明します。このブログをご覧になっている方の多くは実際に研究をやるというよりも、データを読み解く力が必要とされている立場にあると思いますので、細かい方法論よりも、基本的な考え方や統計リテラシーの高め方に重点を置いていきたいと思います。プログラムの特質上、私は統計学部、経済学部、生物統計学部の3か所でこれらの方法論を学んでいますので、分野横断的な内容になると思います。経済学者と統計学者が全く別の話をしていると思ったら実は同じ話をしていた、などという話もあるように、専門分野が異なると使われる専門用語も違えば、因果推論の捉え方(哲学=Philosophy)も変わってきます。しかしながら、それらの底辺に流れる根本的な原理原則を理解することで、各分野の専門家たちがバラバラに決めた「ルール」にとらわれることなく、真実(もしくは真実に近いもの)を理解し、追求することができると考えています。次回以降、以下のようなトピックを一つずつご説明して行きたいと思います。
- 研究デザインの全体像をはっきりさせる
- 因果推論(Causal inference)
- 相関関係(Association)
- 予測モデル(Prediction model)
- 記述統計(Descriptive statistics)
- 相関関係は因果関係ではない(Correlation is not Causation)
- 因果関係(Causation)、相関関係(Association/correlation)、共変(Covary/Covariance)の違い
- 因果関係(原因と結果)の考え方・フレームワーク
- 妥当性(Validity)と信頼性(Reliability)
- 実験(Experiment)と疑似実験(Quasi-experiment)
ちなみに、評価科学・統計学(Evaluative Science and Statistics)とは一見分かりにくい表現なのですが、イメージ図で示するとこのようになります。