「クオリティ・インディケーター（QI）」を用いて医療の質を測り、改善を目指す

日本は患者さんがいつまでも（ほとんど根拠のない）病院ランキングに頼らなくても良いように、客観的な指標を用いて情報を提供するべきだと思います。その一つのカギになるのが、「クオリティ・インディケーター（QI）」です。

医療の最大の目的は、患者さんの健康状態を最大化させることです。そして、「医療の質」を高めることができれば、患者さんは期待されているような健康上のアウトカムが得られる確率が上がると考えられます。医療の質をきちんと評価し、それを高めるためには、まずは医療の質をきちんと妥当性と信頼性の高い形で測定する必要があります。

医療の質を評価する方法にはいくつかあります。そのうち、医療の質を、数値化して（定量的評価）、医療の質改善のためのツールにしたものが、QIになります。もちろん、数字に落とし込まずに医療の質を評価する方法もあり、それは定性的評価と呼ばれますが、どうしても主観的な評価になりがちであるため、QIには多くの場合、定量的評価が用いられます。医療の質を評価し、改善するためにはQIが重要な役割を果たします。ここまでに関しては、コンセンサスが得られていると思います。

QIとドナベディアンの医療の質の３つの側面

まだ議論の余地があるのは、どのようにQIを作成するかという段階の話です。つまり、何をどのように評価することが、医療の質を評価するのに最も優れているのかということに関しては、まだ正解はありません。以前のブログにお書きした通り、ドナベディアンのフレームワークでは、医療の質を評価するのに①ストラクチャー（構造）、②プロセス（過程）、③アウトカム（結果）の3つの側面がありました。そして、このフレームワークに合う形で、3種類のQIが存在します。それぞれの利点と欠点を表１にまとめました。

表1．ドナベディアンの医療の質の3つの側面とQI

	例	利点	欠点
ストラクチャー（構造）	ベッド数、患者１人あたりの看護師の数	測定して数値化することが容易。患者レベルのデータなどのリソースが無くても評価できる。データが不十分な発展途上国ではしばしばQIとして用いられる。	患者の健康アウトカムと相関があるものが少ない。医療提供者が変えることが難しいものも多い。
プロセス（過程）	心筋梗塞後患者に心電図がとられるまでの時間、心筋梗塞患者が来院90分以内にカテーテル治療を受けられた割合、血糖値がきちんとコントロールされている糖尿病患者の割合、糖尿病患者のうち年に１回の眼底検査を受けている患者の割合	アウトカムとの相関は臨床研究で証明されているものが多い（エビデンスに基づいて決めることができる）。アウトカムほどリスク補正の影響を受けない。介入によってある程度影響を与えることができる。	異なる指標のうち優先順位を付けるのが難しい。評価項目が多くなりすぎることがある。既に達成率が高い場合、インパクトが小さい。患者の疾患における特殊な事情を考慮すると実施するべきではない場合もある。患者の選好のため達成できない場合もある。
アウトカム（結果）	死亡率、合併症発生率、患者満足度、生活の質（QOL）	社会や患者が最も重要視する側面である。医療者の理解も得られやすい	重症な患者を診ている医療機関が低く評価されることのないように、リスク補正が必要。リスク補正は完ぺきではなく、まだ改善の余地がある。測定したり介入しても、改善することがしばしば困難である。医療提供者はどのように改善すれば良いか分からなかったり、それを実現するリソースが無いことも多い。

リスク補正が完ぺきであれば、QIはアウトカム評価を用いるのが最適である

技術的問題がないのであれば、QIはアウトカム評価が最適です。なぜならば、死亡率や合併症の有無は、患者や社会が最も重要視している医療サービスのゴールでもあるからです。ここで問題になるのは、単純にアウトカム指標を比較すると、重症な患者を診ている医療機関ほど医療の質が悪いという評価を下されてしまう可能性があると言う点です。この問題を解消するために、リスク補正を行います。つまり、仮に同じような重症度の患者を診ていた場合に、どの医療機関が一番アウトカムが良いか評価するのです。以前まではこのリスク補正の精度が不十分であったのですが、近年ではかなり改善してきており、信頼に足るものになっています（例えば、心筋梗塞患者の30日死亡率ではC-statistic 0.72でした [AHRQ, 2015]）。

リスク補正が完ぺきならばアウトカム評価だけをすれば十分ということになります。しかし、現実にはリスク補正はまだ改善の余地があるため、それを補う形で、プロセス評価が併用されています。実は、今アメリカで多くのプロセス評価が行われているのは、医師や病院などの医療提供者から「リスク補正の精度に不安があるのでアウトカム評価は止めて欲しい」という要望があったからだと言われています。つまり、政府や支払者であるメディケアからすればアウトカム評価だけでも良かったのですが、それだと重症患者を診ている病院に対して不公平であるということで、リスク補正への依存度が低いプロセス指標を併用しているのです。

プロセス指標は、アウトカム評価と比べるとリスク補正への依存度が低いことが特徴です。例えば、糖尿病患者が（網膜症の有無のチェックのため）年に１回眼底検査を受けるべきであるという指標は、患者が重症だろうが軽症だろうが皆チェックを受けるべきです。心筋梗塞が疑われる患者が来院したらできるだけ早く心電図を取るというのも患者の特性に影響されません。心筋梗塞と診断された患者は、患者の重症度に関わらずできるだけ短時間でカテーテル治療を受けるべきです。もちろんリスク補正が100%必要ないというわけではありませんが、アウトカム指標と比べたらリスク補正の影響はかなり少ないと言うことができます。

ストラクチャー指標への支払いは、日本の診療報酬制度では一部行われていますが、多くの先進国ではストラクチャー指標に対する支払いは行われていません。ストラクチャー指標をQIとして用いるのは、発展途上国において、プロセス指標やアウトカム指標のデータ収集が困難である場合が多いです。ストラクチャー指標を改善することで患者の健康状態に取ってプラスになったというエビデンスがほとんどないため（もしくはあっても因果関係が明らかでないものが多いため）、先進国においてQIと言う場合には、今後もプロセス指標かアウトカムの指標に限られると考えられます。

アメリカでは何が起きているのか？

アメリカでは２つの大きな変化が起きています。一つ目はQIの公表であり、もう一つはQIによって医療費の支払い額が変動する業績に伴う支払い制度（Pay-for-performance: P4P）です。このいずれに関しても、推進しているのは公的保険の保険者であるCMS（Centers for Medicare & Medicaid Services）です。

アメリカでは65歳以上の高齢者は実は皆保険制度が達成されており、ほぼ全員公的保険であるメディケアに加入します。CMSはメディケア全米で5,500万人分の支払いを一手に引き受ける巨大な保険者なのです。このCMSはQIの公表やP4Pを導入することにしました。それに決めるにあたって病院や医師の意向はパブリックオピニオンは集めましたが、その影響は限定的だと考えられます。CMSのスタンスとしては、患者には医療の質を知ってそれを元に医療機関を決める権利があり、医療サービスに対価を支払っているCMSにはどのような形で支払うか（量に対して支払うのか、質に対して支払うのか）決める権限があるというものであると、いうものであったような印象を受けます（この部分に関してはあくまで私の印象であり、CMSが正式にそのような声明を出した訳ではありません）。

QIの公表とは、要は医療の質に関する「情報の透明化」です。患者と医療機関との間には大きな情報の非対称性があるため、それを患者に情報を提供することでできるだけ小さくしよういう試みです。CMSのHospital Compareというホームページに行くと、全米でメディケアから支払いを受けいてる全ての急性期病院のQIを、誰でも見ることができます。リスク補正後の各病院のQIが全米平均と比べて、統計学的に良いのか悪いのかということも分かります。さらには、QIの項目が多過ぎて何を基準に選んだら分からないという人のためには、複数のQIを総合的にまとめて一つの指標として、それを５つ星システムで評価してくれています。つまり、ホテルやレストランのように、「５つ星の病院を選ぶ」なんて言うことも可能で、この星の数は、専門家が主観的に選んだものではなく、客観的に評価されたQIの重み付け平均に基づいたものなのです（この5つ星システムに関しては過去のブログをご覧下さい）。

表１．Hospital Compareのホームページ画面（2016年11月13日時点）

（A）心筋梗塞患者のリスク補正後の30日死亡率

AMI mortality.jpg

＊ボストン市内の3つの病院における心筋梗塞患者のリスク補正後の30日死亡率のデータ。全米平均は14.1％であり、各病院の95％確信区間（ベイズで推定される）は黄色の四角で示されている。どの病院も全米平均と変わらないという結果が示されている。

（B）ICUおよび選択された病棟における尿道カテーテル関連の感染症の頻度

＊全米平均を1とした場合の、各病院の感染症発生率を示している。マサチューセッツ総合病院とブリガム・アンド・ウィメンズ病院は全米平均よりも統計学的に有意に発生率が低いことが分かり、それは緑色の四角で示されている。一方で、ベス・イスラエル・ディーコネス・メディカル・センターは全米平均よりも統計学的に有意に高く、そのことは赤色の四角で示されている。ちなみにマサチューセッツ州の平均は0.674であり、全米平均よりもかなり低いことも分かる。

QIを用いたP4Pもかなり進んできています。この背景にあるのは、量に対する支払である出来高払いでは、最適なレベルよりも多い量の医療サービスが提供されてしまうと言う問題があります（医師誘発需要に関しては過去のブログをご参照下さい）。医療経済学的に量に対する支払いに問題があると分かっている以上、代わりの支払い制度が必要であり、理論的には質に対する支払い（アメリカでは価値[Value]に対する支払いと表現されますが同義です）は医療の質を高めることにつながるため、量から質へと支払い制度が移行してきています。オバマケアの下で、2000年にはほぼ100％量に対して医療費は支払われていたものの、2016年には約30％は質に対して支払われるようになってきています。この割合は2018年までに50％に達する予定でしたが、トランプが大統領になったら大きな変更が加えられる可能性があります。

オバマケアの下で導入されたP4Pには主に2つあります。QIに応じて支払い額が変わるHVBP（Hospital Value-Based Purchasing）と、再入院率に応じて支払い額が変わるHRRP（Hospital Readmission Reduction Program）です。実は、2018年からは医師個人に対するP4Pを規定したMACRA（Medicare Access and CHIP Reauthorization Act）が実施される予定だったのですが、こちらもトランプが大統領になったら変更が加えられる可能性があります。

HVBPによって全ての急性期病院が強制的に参加させられ、QIに応じてボーナスやペナルティが課されるようになりました。QIの項目としては、入院後30日死亡率（リスク補正後）などのアウトカム指標に加えて、数々のプロセス指標も採用されていました。さらには、QIの達成率だけでなく、改善率も計算式に含まれており、当初の達成度が低い病院にもきちんとインセンティブが与えられるように設計されていました。一方で、HRRPは特定の疾患において患者の退院後30日以内の再入院率（リスク補正後）に応じてボーナスやペナルティが課されました。

QIの導入が実際に患者のアウトカムが改善したのか、という研究も行われています。HVBPは残念ながら患者の死亡率を改善させるというエビデンスは得られませんでした。（Ryan, 2015; Figueroa, 2016）これはQIの測定項目に問題があった、ボーナス・ペナルティーの額が小さすぎたなどの原因が考えられていますが、答えは明らかになってはいません。英国の例でも同様のP4Pは患者のアウトカムを改善させなかったというエビデンスがあり（Kristensen, 2014）、P4Pをどのようにデザインすれば期待通りに患者のアウトカムを改善するのか関しては分かっていません（P4Pのエビデンスに関しては過去のブログ１、ブログ２もご覧下さい）。

表２．HVBPの患者の死亡率への効果

hvbp

＊HVBP導入の前と後で患者の死亡率は変わっていないことが分かる。

一方で、HRRPは再入院率を統計学的に有意に減らしたというエビデンスがあります。再入院率のようにシンプルな項目に関しては病院側も比較的対処しやすいのですが、死亡率など実際に下げるにはかなりの努力と工夫が必要なアウトカムに関しては思ったような効果が上がっていないというのが現状のようです。

表３．HRRPの再入院率に対する効果

hrrp

＊当初，HRRPの対象となったのは心筋梗塞，心不全，肺炎の3疾患であった。オバマケアが導入された翌月の2010年4月から再入院率は減少し始めたが，12年10月ごろから下降のスピードは鈍化している。HRRPの対象でない疾患でも再入院率は減少したが（波及効果），2つのグループを比較すると対象疾患のほうが統計学的に有意に再入院率が下がっている。

QIは測って公表するべきなのか？それともリスク補正が完ぺきになるまで待つべきなのか？

アメリカでは上記のようにQIの公開や、QIを用いたP4Pが次々と導入されてきており、QIそのものを疑問視する声はもはやあまり聞かれません。アウトカム指標に関してはリスク補正の精度が昔までは悪かったという問題に関しても、今はかなり改善してきており、（未だ改善の余地はあるものの）ある程度信頼できるものになっているというのが共通見解です。しかし、日本ではまだQIに懐疑的な人も多いようです。

医療の質研究の第一人者であるハーバード公衆性大学院のアシシュ・ジャ教授は、「QIには2つの考え方がある。一つ目は、リスク補正やその他の測定の精度が完ぺきではないので、完ぺきになるまでQIに関する公表や支払いは控えるべきであると言う考え方である。もう一つは、患者には医療の質を知る権利があるので、今できるベストなリスク補正をしたQIを公表したり、P4Pに用いて、同時に今後もリスク補正の精度を高める努力を続けて行くという考え方である。私は後者の走りながら改善していくと言う方法の方が良いと考える。」と言います。私もこの考え方に同意しています。

リスク補正の制度に不備があるのは科学の問題であり、患者の問題ではありません。私が患者であれば、例え完ぺきでなかったとしても、今できる限りのリスク補正をした上でのQIを知りたいと考えます。そうしなければ、医療の質に関する情報はほぼゼロになってしまいますし、場合によっては雑誌の病院ランキングのようにより信頼性の低い情報に惑わされてしまうリスクがあります。例えリスク補正が完ぺきじゃなくても、QIに不備があっても、現在日本で入手可能な医療の質の情報である病院ランキングや口コミよりは質の高い情報であると思います。もちろん、推定値が完ぺきなものでないことや、95％信頼区間のような形で推定には「幅」があることをきちんと説明するということが重要になってくることは言うまでもありません。

さらに言うと、おそらくいつまでたってもQIは完ぺきにはならないと思います。完ぺきなリスク補正をするためには、患者の死亡の原因となる情報を全て集める必要があります。一人一人インタビューすれば可能かもしれませんが、レセプトの情報（現実的には主にレセプトの情報を用いてQIは計算する必要があります）ではそのような情報を集めることは現実的ではありません。無限のリソースが無い限り、完ぺきなリスク補正をする、というのは現実的ではありません。よって完ぺきになるのを待っていたら、一生QIは使えず、患者は医療の質を目にすることはないと言うことになると考えられます。

プロセス指標にもまだまだ問題がありますが、それでもなお患者にとっては有用な情報であることには違いないと思います。もし問題があるのであれば、どこか問題で、どのように改善していくべきなのか建設的な議論を行うべきであり、「問題があるから公表しない」というのは問題を先送りしているだけになってしまいます。さらに言うと、プロセス指標にどのような問題があって、どのように改善していくべきなのかを提案できるのは現場で患者を見ている医療提供者だけです。もし医学的理由や患者の選好の理由で、QIの達成度が低くなってしまうのであれば、それがなぜ正当なのか医療者側には説明責任があると思います。医療の質を高めたいと思っているのは、患者、医師、政府、全ての関係者が共通して持っている認識だと思います。透明性を高めて行きながら、どのようにしたら正しく質を評価し、改善していくことができるのあ、関係者が一緒になって建設的な議論を進めていくべきなのではないでしょうか？

医療政策学×医療経済学

「クオリティ・インディケーター（QI）」を用いて医療の質を測り、改善を目指す

2件のコメント追加

コメントを残すコメントをキャンセル

共有:

関連

2件のコメント 追加

コメントを残す コメントをキャンセル

2件のコメント追加

コメントを残すコメントをキャンセル