(写真:nist6dh/クリエイティブ・コモンズ表示 2.0 一般)
業績に基づく支払い方式=ペイ・フォー・パフォーマンス(P4P; pay-for-performance)とは、ガイドラインに則った医療行為を行ったり、患者の健康アウトカム(生存率など)を改善させた医療機関(もしくは医師個人)に対して経済的なインセンティブを与える支払い方式のことです。P4Pは多くの先進国でここ10年くらいで急速に広まってきている支払い方式であり、最近では途上国でも取り入れられようとしています。こんなに「人気者」のP4Pなのですが、実は大多数のエビデンスは患者のアウトカムを改善させないということを示唆していています。一見すると効果がありそうなP4Pですが、何が問題なのでしょうか?
P4Pはロジックとしては極めてシンプルです。消費者(患者や保険者)や国民が期待しているような結果を出すことができたらボーナス(もしくはペナルティー)を与えると言う仕組みですので、感覚的には「効果がありそう」と感じる人が多いのではないでしょうか?ただ、その直感と実際にエビデンスがあることとは別の問題です。P4Pはよりガイドラインに則った治療行為を医療機関に行わせるといういわゆる「プロセス」の部分では効果を発揮するというエビデンスがあるのですが、その下流にある、患者の健康という「アウトカム」を改善させるかどうかと言う点になるとエビデンスはかなり否定的です。P4Pが患者のアウトカムを改善するのかということを検証した研究は複数ありますが、ほとんどのエビデンスは患者のアウトカムの改善には結びつかないことを示唆しています。これほどエビデンスが弱いにもかかわらず、その耳当たりの良さから、先進国のみならず途上国までもP4Pに飛びついてしまっていることは大きな問題だと思われます。
1.医療の質の測り方:ストラクチャ―、プロセス、アウトカム
まず最初に医療の質の基本の話をしましょう。一般的に、医療の質は3つのレベルで評価されます。その3つとは、①ストラクチャー(構造)、②プロセス(過程)、③アウトカム(結果)の3つです。これは1980年に米国のアベディス・ドナベディアンによって提唱されたもので、今では医療の質の評価におけるスタンダードとされています。
- ストラクチャー(構造):施設基準、医療機器の充実度、医療スタッフ(専門職)の種類と人数など
- プロセス(過程):実際に行われた診療行為や看護ケア、ガイドライン遵守率など
- アウトカム(結果):生存率/死亡率、合併症発生率、患者満足度など行われた医療行為の結果のこと
一般的に、患者や医療者が最も重要視するのはアウトカムであるとされています。自分が病気になって病院にかかったときのことを想像してみてください。自分の担当医がガイドライン通りの治療を行っているか(プロセス指標)ももちろん大事ですが、それよりも、自分が生きて帰れるか(アウトカム指標)の方が重要だと感じると思います。
アウトカム指標をP4Pで使うにあたって問題になるのは、重症な患者を数多く診るほどその医療機関のアウトカムは悪くなってしまう可能性があるということです。もちろんアウトカムを評価するときにきちんと「リスク補正」はします。そしてこのリスク補正の精度は年々改善してきており、現在では基本的に大きな問題は無いとされています。それでもなお、医療機関や医師の中では自分の成績が悪くなるのは避けたいので、重症患者を避けるということが起きてしまうかもしれません。この「客観的な測定の難しさ」もしくは「リスク補正の難しさ」が、アウトカムが最も重要であるとされながらも他の指標、特にプロセス指標を併用することが必要になる理由です。
一方で、プロセス指標の客観的評価はそれほど難しくありません。例えば、糖尿病患者のHbA1c値を定期的に測定しているかどうかといったものがプロセス指標になります。これはガイドラインで推奨されている診療行為であり、基本的には(例外的な患者を除いては)医師や医療機関は遵守するべきものです。やったかやらなかったか、だけの話ですので、患者が重症かどうかはあまり関係ありません。つまり「リスク補正」がほとんど必要ないのです。つまり、アウトカムほど重要ではないと考えれているものの、評価がより客観的でリスク補正がきちんとできているかという心配がほとんどないため、プロセス指標は医療の質評価で広く用いられています。ただし、プロセス指標にも欠点はあります。プロセス指標は診療の質の目安に過ぎず、本当に患者にとってメリットがある結果が得られているかどうか明らかではないということです。例えどんなにきちんとHbA1c値を測定していたとしても、脳梗塞や網膜症などの合併症の率が高い医療機関の”医療の質が高い”のかというとはなはだ疑問です。逆に、例えHbA1c値の測定頻度がガイドラインと違ったとしても、糖尿病の合併症の発生率がとても低い医療機関があった場合、それで良いのではないか(少なくとも患者は幸福なのではないか)という考え方もあります(現にガイドラインよりもより進歩的な医療を提供することで患者のアウトカムを改善させている医療施設もあると思われます)。本当の「ゴール」は患者のアウトカムを向上させることであり、プロセス指標はそれを達成するための手段に過ぎないことが、プロセス指標をP4Pに使うにあたって考慮しなければいけない重要なポイントになります。
ストラクチャーももちろん大事なのですが、他の2つと比べると重要性に関して劣るため、P4Pのコンテキストで使われることは比較的まれです。例えば、発展途上国でデータ・インフラが整備されておらず、プロセス指標もアウトカム指標もデータをどうしても収集できないというときには、看護師の数や設備の充実度などのストラクチャー指標が用いられることがあります。しかし、ストラクチャー指標と患者のアウトカムとの相関はそれほど強くないため、データを収集できるような状況になればできるだけ早くプロセス指標やアウトカム指標へフォーカスを変えた方が良いと考えられています。ちなみに、日本の診療報酬制度では、看護職員1人に対する入院患者の人数で支払われる金額が変わってきますが、これはストラクチャ―に対するP4Pに近いと考えられます。
以上のような様々な理由より、以前はP4Pはプロセス指標を測定してボーナスを与えていたのに対して、現在ではプロセス指標とアウトカム指標を組み合わせたものが主流となっています。
P4Pに関する最新のエビデンスに関しては、2017年5月に米国内科学会誌に掲載されたシステマティックレビューが詳しいです。質の高いエビデンスは米国と英国からしか出ておらず、P4Pはプロセス指標は改善するが、アウトカム指標を改善するという根拠は無い(現時点のデザインでは失敗である)という結論です。
ここからは、イギリスとアメリカにおけるP4Pの歴史と、そのインパクト評価の結果をご紹介します。
2.アメリカにおけるP4P
HQID:病院に対する任意加入のP4P(2003~2006年)
アメリカではまず、Premier Hospital Quality Incentive Demonstration Project(HQID)という実験が2003~2006年に行われました。このプロジェクトでは、任意で参加した262の病院を対象に、プロセス指標とアウトカム指標を組み合わせた34の指標を設定して、それに対して経済的なインセンティブを与えました。HQIDの導入によってプロセス指標は改善したものの(Lindenauer, NEJM, 2007)、死亡率などの患者のアウトカム指標(死亡率)に関しては影響がなかったことが証明されました。(Jha, NEJM, 2012; Ryan, HSR, 2015)
VBP:病院に対する強制加入のP4P(2012年~)
2012年より、アメリカではHQIDをもとにして、メディケアの支払いを受けている全病院を対象にしたP4PであるValue-Based Purchasing Program(VBP)が導入されました(HQIDは任意参加でしたがVBPは強制参加です)。HQIDがプロセス指標のみをP4Pのターゲットにしていたのに対して、VBPはプロセス指標だけでなく、患者の30日死亡率などのアウトカム指標も直接P4Pのターゲットにしているという点で画期的であると言われています。さらには、VBPはある一定のレベルを達成できるかどうかだけでなく、改善した割合(変化率)に対しても経済的インセンティブを与えています。私達の研究によると、VBPの導入によって患者の死亡率の改善は認めせんでした。(Figueroa, BMJ, 20216)さらには、プロセス指標や患者満足度に関しても改善が見られないと報告されています。(Ryan, NEJM, 2017)
3.イギリスにおけるP4P
QOF:かかりつけ医に対するP4P(2004年~)
イギリスでは、2004年よりQuality and Outcome Framework(QOF)(「クォフ」と読む)と呼ばれるP4Pが導入されました。かかりつけ医(GP)において、10の慢性疾患、医療機関のケア、患者の満足度を対象に、146の審査基準が設けられ、ポイントの高い医師にはボーナスが支給されるようになりました。このQOFが医療の質の向上させたかというとエビデンスはどちらかというと否定的です。例えば、QOFの導入によって高血圧患者の血圧のコントロールが改善されたかどうか、分割時系列デザイン(ITS)を用いて解析を行った研究がありますが、高血圧のコントロールはQOF導入前から改善傾向にあり、この政策導入によるインパクトはほとんどないことが明らかになりました。(Serumanga, BMJ, 2011)
Advancing Quality:病院に対するP4P(2008年~)
アメリカで開発されたHQIDは、2008年にAdvancing Qualityという名前でイギリスに輸入され、イギリス北西部の全24のNHSが所有する病院で導入されました。このプログラムは患者の死亡率を下げたという研究結果がありますが(Sutton, NEJM, 2012)、良く論文を読んでみるとこの結論には疑問を持たざるをえません。検証された3つの疾患のうち、患者のアウトカムを改善させたのは1つに過ぎなかったからです。肺炎の死亡率は下がっているのですが、心筋梗塞と心不全の死亡率には影響がなかったのです。この結果をみて患者のアウトカムを改善させたと言うのは若干強引である気がします。正確には、「P4Pは疾患によっては患者のアウトカムを改善させることがあるかもしれない」というのがこの研究から導き出すことのできる正しい結論なのだと思います。さらに特筆すべきは、同じグループがこのP4Pの長期的なインパクトを評価したところ、42ヶ月経ったところではP4Pの患者の予後へのインパクトは無くなっていました。(Kristensen, NEJM, 2014)まとめると、Advancing Qualityは短期的には疾患によって患者の予後を改善させたが、長期的にはインパクトが無かったと考えらています。
4.なぜP4Pは患者のアウトカムに「効果が無い」のか?
数多くの研究結果を総合的に判断すると、P4Pは患者のアウトカムを改善させないというエビデンスの方が優勢です。例え、患者の30日死亡率自体をボーナスのターゲットにしたとしても、その30日死亡率を下げることにはつながらないというのは正直おどろきです。この分野の専門家(ハーバード公衆衛生大学院のアシシュ・ジャ教授やメレディス・ローゼンタール教授)と議論すると、P4P自体の目的は悪くないが、そのデザインに問題がある、という意見を持っている人がほとんどです。つまり、どの指標を測定するか、ターゲットをどのレベルにするか、経済的インセンティブの大きさをどれくらいにするか(全体の支払いに対するP4Pによるボーナスの大きさをどれくらいに設定するか)などの要素に関して世界は正解をまだ知らないのだと考えられています。ボーナスの大きさを問題視する人は多いですが、イギリスでは収入の30%前後をP4Pに紐づけしてもアウトカムの改善が認められなかったため、筆者は懐疑的です。
世界の大きな潮流としては、今までの、診療行為の量が多ければ多いほど医療機関への支払いが多くなると言う「量に対する支払い」(=出来高払い)には問題があることを多くの国が認めています。このシステムの下では、提供される医療サービスの量が最適なレベルよりもどうしても高いところでキープされてしまうからです(詳しくは医師誘発需要の記事をご覧下さい)。世界中の国が医療費高騰に苦しんでいる中で、「量に対する支払い」から、「包括支払い方式」に移行していくのは自然の流れです。しかし、包括支払い方式の一番の問題点は、医療行為を少なくすれば少なくするほど医療機関が儲かってしまうという部分です。この包括支払い方式の弱点に対抗するために導入されたのがP4Pというツールであると捉えることができきます。包括支払い方式とP4Pを組み合わせることで、前者が医療機関に対してより少ない医療費でケアを提供するインセンティブを与える一方で、後者がアウトカムを良好なものにするインセンティブを与えます。包括支払い方式にすることで医療費を抑制できるのは明らかです。今我々が必要としているのは、きちんと期待通りに患者のアウトカムの改善につながるような、P4Pの正しいデザインを明らかにすることです。
Volume(量)に対して支払い続けることには問題があるので、Value(価値)に対して支払うしかない(他に選択肢が無い)ということで、P4Pには大きな期待が寄せられています。ただし、どのようなデザインのP4Pが良いかはまだエビデンスがないので、それがはっきりと分かるまでは(制度変更するコストが無駄になってしまうため)やみくもにP4Pを導入するべきではないと個人的には考えています。もし仮にP4Pを日本で導入するとしても、複数のデザインのP4Pを用意して、きちんとそれぞれのインパクト評価をきちんと行いながら、最も効果的なデザインを検証していくという、実験的なプロセスが必要であると思われます。