評価科学と統計学(Evaluative Science & Statistics)

ESS3

ビッグデータを解析するに当たっては、正しい因果推論の方法論を用いることがとても重要になります。正しい因果推論の方法論を用いずにビッグデータを解析すると、高い精度で(狭い信頼区間で)バイアスのかかった間違った結果を導き出してしまい、逆に「たちが悪い」です。そして、その結果を信じて行動すると予想した効果が得られないという残念なことになってしまいます。

これから数回にわたって統計データや研究結果の読み方に関してご説明します。このブログをご覧になっている方の多くは実際に研究をやるというよりも、データを読み解く力が必要とされている立場にあると思いますので、細かい方法論よりも、基本的な考え方や統計リテラシーの高め方に重点を置いていきたいと思います。プログラムの特質上、私は統計学部、経済学部、生物統計学部の3か所でこれらの方法論を学んでいますので、分野横断的な内容になると思います。経済学者と統計学者が全く別の話をしていると思ったら実は同じ話をしていた、などという話もあるように、専門分野が異なると使われる専門用語も違えば、因果推論の捉え方(哲学=Philosophy)も変わってきます。しかしながら、それらの底辺に流れる根本的な原理原則を理解することで、各分野の専門家たちがバラバラに決めた「ルール」にとらわれることなく、真実(もしくは真実に近いもの)を理解し、追求することができると考えています。次回以降、以下のようなトピックを一つずつご説明して行きたいと思います。

  1. 研究デザインの全体像をはっきりさせる
    1. 因果推論(Causal inference)
    2. 相関関係(Association)
    3. 予測モデル(Prediction model)
    4. 記述統計(Descriptive statistics)
  2. 相関関係は因果関係ではない(Correlation is not Causation)
    • 因果関係(Causation)、相関関係(Association/correlation)、共変(Covary/Covariance)の違い
  3. 因果関係(原因と結果)の考え方・フレームワーク
    1. 統計学における因果推論(ルービンの因果モデル)
    2. 心理学における研因果推論(キャンベル)
    3. 疫学における因果関係ダイアグラム(Causal diagram)
  4. 妥当性(Validity)と信頼性(Reliability)
  5. 実験(Experiment)と疑似実験(Quasi-experiment)
    1. 操作変数法(IV; Instrumental variable methods)
    2. プロペンシティ・スコア・マッチング(PS; Propensity score matching)
    3. 回帰分断デザイン(Regression discontinuity method)・分割時系列デザイン(Interrupted time-series analysis)
    4. 差分の差分分析(DID; Difference-in-differences design)

ちなみに、評価科学・統計学(Evaluative Science and Statistics)とは一見分かりにくい表現なのですが、イメージ図で示するとこのようになります。 ESS

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中