心理学における因果推論(キャンベル)

Donald_T_Campbell-lg

Donald Campbell

2010年にアメリカ心理学会の公式の学術雑誌であるPsychological Methodsで非常に興味深い特集が組まれました。前述の統計学者ルービンの因果推論と、心理学者であるドナルド・キャンベルの因果推論の対決をさせよう、というものでした。キャンベルと一緒に教科書を書いているウィリアム・シャディッシュ、経済学者のグイド・インベンス、そしてルービン本人も議論に参加しており、とても活発な議論が行われました。

因果推論のバイブルとも言える一冊です。もともと1963年に心理学者ドナルド・キャンベルとジュリアン・スタンリーの二人によって同名の教科書として書かれた由緒ある本です。1979年にクックとキャンベルによって改定版の第一版が出版されました。2002年には第二版が出版されるのですが、この時に筆者が一人増えて、シャディッシュ、クック、キャンベルの3者による共著となりました。最新版はこの3者による本なのですが、第二版が有名であるため、今でもしばしば「クックとキャンベルの本」と呼ばれる名著です。「内的妥当性(Internal validity)」、「外的妥当性(External validity)」という言葉を初めて使ったのはキャンベルであると言われています。内的妥当性があるということは、すなわち相関関係から因果関係を導くことができる、ということを意味しています。つまり内的妥当性こそが因果推論の核となる部分なのです。一方で、外的妥当性とは、ある時代にある集団で得られた知見が、他の時代もしくは他の集団でも同じように得られるかどうか?ということです。外的妥当性は、一般化可能性(Generalizability)と呼ばれることもありますが、同義です。因果推論においては、キャンベルは「内的妥当性を脅かすもの(Threats to internal validity)」をリストアップして、研究を始める段階で一つ一つ予防策を講じておくことで正しい因果関係を導くことができると考えました。

SCC

内的妥当性を脅かすもの」には以下のようなものがあります。

  1. 原因と結果の逆転:原因が結果を引き起こしているのではなく、結果と思われるものが原因を引き起こしている。経済学では「同時性(Simultaneity)」、疫学では「因果の逆転(Reverse causality)」と呼ばれる。
  2. 選択(Selection):治療群とコントロール群の比較をしている場合、これら2つのグループが大きく異なっている状態。比較可能(Comparable)な状態ではないので、見かけ上の治療効果は、治療そのものの影響ではなく、その他の因子の影響である可能性がある。
  3. 歴史的因子(History):治療前と治療後の間に起こった「治療」以外の因子が影響を与えており、(治療そのものではなく)その因子の影響を見てしまっているだけである。
  4. 成熟(Maturation):自然経過で起こった経時変化(何もしなくても起こっていた自然変化)を治療効果のように受け取ってしまうこと。
  5. 回帰(Regression):あらゆるデータにおいて、極端な値は時間とともに平均値に近づいていくことが一般的な統計学的法則として知られている。これを「平均への回帰(Regression to the mean)」と呼ぶ。治療前のデータがその極端な値である場合、治療自体に効果が無くても、データは平均値に近づいていくため、あたかも治療に効果があるように見えてしまう現象のこと。
  6. 脱落(Attrition):もしサンプル集団の一部で結果(アウトカム)が観察されず、そのデータ欠損が治療群の対照群で異なったパターンで見られた場合、見かけ上の治療効果は真の値とは異なったになってしまう可能性がある。これはRCTであっても起こりうる数少ない「脅威」の一つである。疫学の世界では「追跡不能者(Lost to follow-up)」と呼ばれる。
  7. テスト効果(Testing effects):テストを受ける行為そのものに学習効果があるため、コントロール群がない単純な前後比較を用いて介入の効果を見ている場合、あたかも2回のテストの間に実施された介入に効果があったように見えてしまう。
  8. 測定方法の変更(Instrumentation):何かを定量化するときに、そのデータを取るために用いた手段が変わっていると評価不能になってしまうこと。
  9. 上記の因子の組み合わせ:上記1~8の問題は2つ、3つが組み合わさってより複雑な問題になることもある。例えば、そもそも2群が比較可能ではなくて、その上でさらに片方のグループにのみに治療以外の(前測定と後測定の間に)別のイベントが起こってしまっている場合、これは「選択×歴史的因子」の問題となる。

ルービンがデータが目の前に既にあるものとして、どのように「統計解析」すれば正しい因果推論を行うことができるのかを考えたのに対して、キャンベルはデータを集める前の段階で、どのような「研究デザイン」を計画すれば正しく因果関係を導くことができるかを強調しました。つまり、ルービンとキャンベルの因果推論に関する考え方は対立するものではなく、補完的な意味合いを持っているということが分かって頂けると思います。

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中