10.3 比例ハザード性の検証と拡張

Cox比例ハザードモデルは、生存時間分析において共変量が生存確率に与える影響を評価するための標準的な手法です。しかし、このモデルが妥当な結果を導出するためには、「比例ハザード性（Proportional Hazards Assumption）」という非常に強力な前提条件が満たされている必要があります。

本稿では、比例ハザード性の数学的な意味とその検証方法（Schoenfeld残差検定など）、およびこの前提が満たされない場合に採用すべき拡張モデル（層別化モデル、時間依存性共変量モデル）について、具体的な事例を交えて解説します。

1. 比例ハザード性の前提とは何か

Cox比例ハザードモデルにおける任意の個体のハザード関数 $h(t|X)$ は、以下の式で定義されます。

$$
h(t|X) = h_0(t) \exp(\beta_1 X_1 + \beta_2 X_2 + \dots + \beta_p X_p)
$$

ここで、$h_0(t)$ はベースラインハザード関数（すべての共変量が0のときのハザード）、$X$ は共変量ベクトル、$\beta$ は偏回帰係数ベクトルです。

この式から、2つの異なる個体（共変量が $X_A$ と $X_B$）のハザード比（Hazard Ratio: HR）を計算すると、時間 $t$ に依存するベースラインハザード関数 $h_0(t)$ が相殺されます。

$$
\text{HR} = \frac{h(t|X_A)}{h(t|X_B)} = \frac{\exp(\beta X_A)}{\exp(\beta X_B)} = \exp(\beta(X_A – X_B))
$$

この結果が示すのは、「2つのグループ間のハザード比は、時間が経過しても常に一定である」ということです。これが比例ハザード性の前提です。もし、ある治療薬の効果が投与直後は高いものの、時間の経過とともに減弱していくような場合、ハザード比は時間に対して一定ではなくなるため、通常のCoxモデルを適用することは不適切となります。

2. 比例ハザード性の検証手法

モデルを構築した後は、この前提がデータにおいて成立しているかを必ず検証する必要があります。検証には主に統計的検定と図示的アプローチが用いられます。

Schoenfeld残差（Schoenfeld Residuals）を用いた検証

Schoenfeld残差は、Coxモデルの比例ハザード性を検証するための最も標準的な指標です。事象（死亡や離脱など）が発生した各時点において、「実際に事象を経験した個体の共変量の値」と、「その時点で事象を経験するリスクがあった集団（リスク集合）から期待される共変量の値」との差分として計算されます。

もし比例ハザード性が成立しているならば、共変量の影響力 $\beta$ は時間に対して一定であるため、Schoenfeld残差と事象発生時間 $t$ との間に相関関係は観察されないはずです。したがって、残差と時間（または時間の対数）との相関を統計的に検定し、帰無仮説（比例ハザード性が成立している）が棄却された場合、前提違反と判断します。

検証手法の比較

比例ハザード性の検証には、Schoenfeld残差以外にもいくつかのアプローチが存在します。それぞれの特徴を以下の表に整理します。

検証手法	概要	長所	短所
Schoenfeld残差の検定	残差と時間の相関を統計的に検定し、プロットの傾きを評価する。	統計的な有意差として客観的に判断可能。時間依存の傾向を視覚的にも確認できる。	サンプルサイズが極端に大きい場合、微小な変動でも帰無仮説が棄却されやすい。
対数マイナス対数生存曲線（Log-minus-log plot）	$\log(-\log(S(t)))$ を時間の対数に対してプロットする。	視覚的かつ直感的に分かりやすい。2つの曲線が平行であれば前提成立とみなす。	カテゴリ変数にしか適用できない。連続変数の場合はカテゴリ化が必要となる。
観測値と予測値の比較	Kaplan-Meier曲線（観測値）とCoxモデルからの予測生存曲線を重ねて描画する。	モデル全体の当てはまりの良さ（Goodness-of-fit）を包括的に確認できる。	どの変数が前提に違反しているかの特定が困難である。

3. 前提違反時の拡張アプローチと具体例

比例ハザード性が満たされない場合、誤った結論を導くのを防ぐためにモデルの拡張が必要です。主に「層別化Coxモデル」と「時間依存性共変量を組み込んだモデル」の2つが選択されます。

【事例】外科手術と投薬治療の生存時間比較

ある疾患に対する「治療法A（外科手術）」と「治療法B（投薬治療）」の生存時間を比較する臨床試験のデータを想定します。

治療法A（外科手術）： 手術直後は合併症のリスクがありハザード（死亡率）が高いが、長期的には根治の可能性が高くハザードは低下する。
治療法B（投薬治療）： 手術のような初期の急激なリスクはないが、長期的な根治率は低く、ハザードは時間とともに緩やかに上昇する。

このデータを通常のCoxモデルで分析すると、初期は治療法Bが優位、後期は治療法Aが優位となり、ハザード比が時間経過に伴って逆転（生存曲線が交差）します。これは明らかな比例ハザード性の違反です。この違反に対処するための手法は以下の通りです。

アプローチ1：層別化Coxモデル（Stratified Cox Model）

前提違反を起こしている変数の効果を直接推定する必要がない（交絡因子として統制したいだけ）場合に有効な手法です。比例ハザード性を満たさない変数（上記の例であれば「治療法」）ごとにベースラインハザード関数 $h_{0g}(t)$ を個別に設定します。

$$
h_g(t|X) = h_{0g}(t) \exp(\beta_1 X_1 + \beta_2 X_2 + \dots)
$$

ここで、$g$ は層（治療法AまたはB）を表します。このモデルでは、層ごとのベースラインの形状の違いを許容しつつ、その他の共変量（年齢や血圧など）の効果 $\beta$ を全層で共通として推定します。欠点としては、層別化した変数（治療法）そのもののハザード比は算出できなくなります。

アプローチ2：時間依存性共変量（Time-Dependent Covariates）の導入

前提違反を起こしている変数の効果そのもの（治療法の効果が時間とともにどう変化するか）を定量的に評価したい場合に用いる高度な拡張モデルです。効果が時間 $t$ に依存して変化することを許容するため、共変量と時間との「交互作用項」をモデルに組み込みます。

$$
h(t|X) = h_0(t) \exp(\beta_1 X_1 + \beta_2 (X_1 \times g(t)) + \dots)
$$

ここで、$g(t)$ は時間の関数（例えば、$t$ そのものや $\log(t)$ など）です。このモデルにおける変数 $X_1$ の効果（ハザード比の対数）は $\beta_1 + \beta_2 g(t)$ となり、時間の関数として動的に計算されます。

先の事例において時間依存性共変量モデルを適用した場合、「$\beta_1$ は正（初期は治療法Aのハザードが高い）」かつ「$\beta_2$ は負（時間の経過とともに治療法Aのハザードが相対的に減少する）」という結果が推定され、治療効果の時間的変化を統計的に証明することが可能となります。

まとめ

Cox比例ハザードモデルを適用する上で、比例ハザード性の検証は不可避のプロセスです。

Schoenfeld残差検定等の手法を用いて、各変数の影響力が時間に対して一定であるかを客観的に評価する。
前提が満たされない変数が存在する場合、その変数が単なる統制変数であれば「層別化」を検討する。
その変数の効果自体が分析の主目的である場合は、「時間依存性共変量」を組み込んだモデルへと拡張し、時間的変化を正確にモデリングする。

これらの手続きを適切に踏むことで、時間とともに変化する複雑な事象に対しても、偏りのない妥当な生存時間分析を実行することが可能となります。

Movies

TV Shows

Music

Celebrity

Scandals

Drama

Lifestyle

Health

Technology

Company