Top 5 This Week

関連記事

5. Nelson-Aalen推定量:累積ハザード関数の推定

- 本サイト運営者のサービスの紹介 -

累積ハザード関数とは何か

生存分析において、ある時刻 $t$ までにイベントが発生するリスクの蓄積量を定量化する関数が累積ハザード関数 $H(t)$ です。連続時間モデルでは、瞬間ハザード関数 $h(u)$ を時刻 0 から $t$ まで積分することで定義されます。

$$
H(t) = \int_0^t h(u)\,du
$$

$h(u)$ は微小区間 $[u, u+du)$ においてイベントが発生する条件付き確率の密度であり、$H(t)$ はその時刻までの累積量を表します。$H(t)$ は単調非減少関数であり、$H(0)=0$、$H(\infty)=\infty$ が成立します。指数分布を例にとると $h(u)=\lambda$(定数)であり、$H(t)=\lambda t$ という線形関数となります。Weibull分布では $h(u)=\lambda\kappa u^{\kappa-1}$($\kappa>0$ は形状パラメータ)であり、$H(t)=\lambda t^\kappa$ という冪乗関数となります。生存関数 $S(t)$ との関係は指数変換によって結ばれます。

$$
S(t) = \exp(-H(t))
$$

この関係式から、$H(t)$ を推定した後に $\hat{S}(t)=\exp(-\hat{H}(t))$ として生存確率を回復できます。$S(t)$ と $H(t)$ は一対一に対応しているため、どちらか一方を推定すれば他方も一意に決まります。観測データに基づく離散近似では次式が用いられます。

$$
H(t) \approx -\log S(t)
$$

累積ハザードの解釈として、$H(t)=1$ は時刻 $t$ までに期待値として1件のイベントが発生するリスクに相当し、$H(t)=2$ は2件分のリスクが蓄積されたことを意味します。生存確率 $S(t)$ が $[0,1]$ に制限されるのに対し、$H(t)$ は $[0,\infty)$ の範囲をとります。この無制限のスケールにより、複数群のハザード比較において線形的な取り扱いが容易になります。また、$H(t)$ に対するlog変換やlog-log変換が後述の比例ハザード仮定の視覚的診断で有効に機能します。こうした性質から、現代の生存分析理論では累積ハザード関数が中心的概念として位置づけられています。さらに、Cox比例ハザードモデルや加速故障時間モデルなど多くのパラメトリック・セミパラメトリックモデルが $H(t)$ を基礎として定式化されています。生存分析の非ノンパラメトリック推定においても、$H(t)$ を直接推定するNelson-Aalen推定量と生存確率 $S(t)$ を直接推定するKaplan-Meier推定量が相補的に用いられており、両者の関係を理解することが実践的な解析の基礎となります。

Nelson-Aalen推定量の定義と導出

観測データ $\{(t_i, \delta_i)\}$ において、$t_i$ は観測時間(イベントまたは打ち切り)、$\delta_i=1$ はイベント発生、$\delta_i=0$ は打ち切りを示します。イベント発生時刻を昇順に並べ $t_{(1)} < t_{(2)} < \cdots$ とし、各時刻で次の量を定義します。$d_j$:時刻 $t_{(j)}$ でのイベント数、$n_j$:時刻 $t_{(j)}$ 直前のリスク集合サイズ(時刻 $t_{(j)}$ を超えて生存または打ち切りとなった全個体数)です。打ち切り観測はその観測時刻の直後にリスク集合から脱出するため、$n_j$ は時刻の進行とともに自然に減少します。Nelson-Aalen推定量は各イベント時刻での増分の累積和として定義されます。

$$
\hat{H}(t) = \sum_{t_{(j)} \leq t} \frac{d_j}{n_j}
$$

各増分 $d\hat{H}(t_{(j)}) = d_j / n_j$ は時刻 $t_{(j)}$ における経験的ハザード率の推定に対応します。カウントプロセスの枠組みでは、$d_j/n_j$ はリスク集合 $n_j$ を分母とする局所的なイベント率であり、独立打ち切り仮定のもとで $h(t_{(j)})\Delta t$ の推定量として理論的に正当化されます。この増分をイベント時刻ごとに累積することで、連続時間の積分 $\int_0^t h(u)du$ を離散観測から近似します。

以下の表は6時点の小規模データを用いた逐次計算の例を示します。

時刻 $t_{(j)}$ イベント数 $d_j$ リスク集合サイズ $n_j$ 増分 $d_j/n_j$ 累積ハザード $\hat{H}(t_{(j)})$
2 1 10 0.100 0.100
4 1 9 0.111 0.211
5 2 8 0.250 0.461
8 1 6 0.167 0.628
10 1 5 0.200 0.828
13 1 4 0.250 1.078

時刻 5 でのイベント数は 2 であり、リスク集合サイズ $n_j=8$ に対して増分 $2/8=0.250$ が加算されます。時刻 4 と 5 の間で打ち切りが1件あった場合(その観測が時刻 4 のイベント後・時刻 5 のイベント前に打ち切られたとすると)、$n_j$ は時刻 4 の後に 1 減少し、時刻 5 では $n_j=8$ となります。このようにリスク集合のサイズが打ち切りによって自然に調整される仕組みが、Nelson-Aalen推定量の特長です。

推定量の妥当性には2つの仮定が前提となります。第一に、打ち切り機構と生存時間が統計的に独立であること(独立打ち切り仮定)です。第二に、打ち切りが将来の生存確率に関する情報を持たないこと(無情報打ち切り仮定)です。たとえば、病状の悪化が観察打ち切りの直接的な原因となっている場合、打ち切り時点の情報が生存確率と関連するため、無情報打ち切り仮定は成立しません。同様に、同じリスク要因に晒される集団内で行政的都合による追跡打ち切りが特定の群に集中する場合も独立打ち切り仮定の成立が疑われます。これらが成立しない状況では $d_j/n_j$ の期待値が真のハザード増分からずれ、系統的バイアスが生じます。また、イベント数 $d_j$ が少ない時刻では増分 $d_j/n_j$ の統計的不安定性が増大し、推定値の変動が大きくなります。

分散推定と信頼区間の構成

マルチンゲール理論に基づくと、Nelson-Aalen推定量の分散はNelson分散推定量によって推定されます。

$$
\widehat{\mathrm{Var}}[\hat{H}(t)] = \sum_{t_{(j)} \leq t} \frac{d_j}{n_j^2}
$$

各時点での寄与 $d_j/n_j^2$ は増分 $d_j/n_j$ を $n_j$ でさらに除したものであり、リスク集合が小さいほど分散への寄与が大きくなる構造をもちます。カウントプロセスの枠組みでは、この分散推定量は二次変動過程の推定として正当化されます。$\hat{\sigma}(t)=\sqrt{\widehat{\mathrm{Var}}[\hat{H}(t)]}$ とおきます。

$U=\log\hat{H}(t)$ に対してデルタ法を適用すると、$dU/d\hat{H}=1/\hat{H}(t)$ より $U$ の漸近分散は $\hat{\sigma}^2(t)/\hat{H}^2(t)$ となります。$U$ スケールで正規近似のもとに信頼区間を構成し、$H(t)$ スケールへ逆変換することで、log変換に基づく $100(1-\alpha)\%$ 信頼区間が得られます。

$$
\left[\hat{H}(t)\cdot\exp\!\left(-\frac{z_{\alpha/2}\,\hat{\sigma}(t)}{\hat{H}(t)}\right),\;\hat{H}(t)\cdot\exp\!\left(+\frac{z_{\alpha/2}\,\hat{\sigma}(t)}{\hat{H}(t)}\right)\right]
$$

log変換は $\hat{H}(t)>0$ の制約を自動的に保証し、直接正規近似より被覆確率が向上します。$\hat{H}(t)$ に直接正規近似を適用すると下限が負になり得ますが、log変換後のスケールで信頼区間を構成し逆変換することでその問題を回避できます。特に追跡期間の後半でイベントが少なく $\hat{H}(t)$ が急上昇する状況では、log変換の恩恵が大きくなります。

さらに $W=\log(\log\hat{H}(t))$ に対してデルタ法を適用します。$dW/d\hat{H}=1/(\hat{H}(t)\log\hat{H}(t))$ より、$W$ の漸近分散は $\hat{\sigma}^2(t)/(\hat{H}(t)\log\hat{H}(t))^2$ と求められます。$W$ スケールでの信頼区間を $H(t)$ スケールへ2段階で逆変換すると、log-log変換に基づく信頼区間が次式で与えられます。

$$
\left[\hat{H}(t)^{\exp\!\left(-z_{\alpha/2}\cdot\frac{\hat{\sigma}(t)}{\hat{H}(t)\log\hat{H}(t)}\right)},\;\hat{H}(t)^{\exp\!\left(+z_{\alpha/2}\cdot\frac{\hat{\sigma}(t)}{\hat{H}(t)\log\hat{H}(t)}\right)}\right]
$$

指数の底が $\hat{H}(t)$ であり、指数部 $\exp(\pm\delta)$($\delta=z_{\alpha/2}\hat{\sigma}(t)/(\hat{H}(t)\log\hat{H}(t))$)が冪乗として作用します。この点がlog変換信頼区間における乗法的な $\hat{H}(t)\cdot\exp(\pm\cdot)$ の形式とは本質的に異なります。log-log変換は $\hat{H}(t)$ の値が小さい領域での被覆精度を向上させる傾向があり、後述の比例ハザード仮定診断に使用するlog-logプロットとの理論的整合性も持ちます。この漸近理論の前提は、大標本における漸近正規性であり、その数学的根拠はマルチンゲール中心極限定理です。観測されたカウントプロセスを適切な標準化のもとで極限操作すると、Nelson-Aalen推定量は真の累積ハザードを中心とする正規分布に収束します。この漸近正規性が成立するためには標本サイズが十分に大きく、各イベント時刻でのリスク集合サイズ $n_j$ が有限値に縮退しないことが条件となります。標本サイズが十分でない小標本では正規近似の精度が低下し、信頼区間の被覆確率が名目水準 $1-\alpha$ から乖離します。同着イベント(タイ)が多い場合には分散推定値が過小評価となる可能性があることにも注意が必要です。

Nelson-Aalen cumulative hazard curves with 95% CI for two groups

(Fig1. Nelson-Aalen推定量による2群の累積ハザード曲線と95%信頼区間)

Kaplan-Meier推定量との関係:Fleming-Harrington変換とBreslow推定量

Nelson-Aalen累積ハザード推定量から生存関数を回復する手法をFleming-Harrington変換と呼びます。

$$
\hat{S}_{FH}(t) = \exp\!\left(-\hat{H}_{NA}(t)\right)
$$

一方、Kaplan-Meier推定量は各イベント時刻での生存率の積として定義されます。

$$
\hat{S}_{KM}(t) = \prod_{t_{(j)} \leq t}\left(1 – \frac{d_j}{n_j}\right)
$$

KM増分とNA増分の接続は $\log(1-x)\approx -x$($x$ が小さいとき)という近似によって説明されます。$\log\hat{S}_{KM}(t)=\sum_{t_{(j)}\leq t}\log(1-d_j/n_j)$ において各項を $-d_j/n_j$ で近似すると $-\hat{H}_{NA}(t)$ が得られ、$\hat{S}_{KM}(t)\approx\hat{S}_{FH}(t)$ となります。より精密には $\log(1-x)<-x$($x\in(0,1)$)が成立するため、$\log\hat{S}_{KM}(t)<\log\hat{S}_{FH}(t)$ すなわち $\hat{S}_{KM}(t)<\hat{S}_{FH}(t)$ となります。標本サイズが大きくなるにつれて両推定量は漸近的に一致しますが、小標本ではFleming-Harrington推定量がKaplan-Meier推定量よりわずかに上方にずれる傾向があります。この系統的差異は、各増分での $\log(1-d/n)$ と $-d/n$ の差の蓄積によって生じます。報告目的が生存確率の直接比較である場合にはKaplan-Meierを、ハザード構造の分析や後続のCox回帰の補助としてFleming-Harrington変換を適用するという使い分けが実践上の指針となります。

Cox比例ハザードモデルでは、回帰パラメータの推定後にベースライン累積ハザード $H_0(t)$ をデータから推定する必要があります。Breslow推定量はこの目的に用いられ、各イベント時刻での増分を各個体のリスクスコアの合計で除する形式をとり、共変量の効果を考慮した上でNelson-Aalen型の累積和を構成します。Cox回帰の文脈でBreslow推定量が標準的に採用される理由は、部分尤度推定量との理論的整合性にあります。Breslow推定量から得られるベースライン生存関数 $\hat{S}_0(t)=\exp(-\hat{H}_0(t))$ は、特定の共変量プロファイルをもつ個体の生存曲線推定や予後スコアの算出に応用されます。共変量を調整しない状況での記述的推定にはNelson-AalenまたはKaplan-Meierが用いられますが、Cox回帰の枠組みに入ったときにはBreslow推定量が実質的な標準です。

Fleming-Harrington vs Kaplan-Meier survival comparison in small sample

(Fig2. Fleming-Harrington推定量とKaplan-Meier推定量の比較:小標本での差異)

小標本バイアスと補正推定量

Nelson-Aalen推定量には上方バイアスが存在し、その近似式は次式で表されます。

$$
E[\hat{H}(t)] – H(t) \approx \sum_{t_{(j)}\leq t}\frac{d_j(n_j – d_j)}{n_j^2}
$$

各時点での寄与 $d_j(n_j-d_j)/n_j^2$ は $n_j$ が小さいほど大きくなります。$n_j=5$ のときの各項の寄与は $n_j=50$ のときと比べて10倍以上となります。このバイアスは、$d_j/n_j$ が真のハザード増分の不偏推定量であるにもかかわらず、累積和の非線形性(指数変換との組み合わせ)と有限標本での高次項の寄与によって発生します。打ち切りが多く標本サイズが小さいコホートでは、各時点でのバイアスが蓄積されて無視できない水準に達します。

バイアスを軽減するための補正として、Nelson補正では各イベント時刻での増分を次式で置き換えます。

$$
d\hat{H}_{Nelson}(t_{(j)}) = \frac{d_j}{n_j+1}
$$

Harrington-Fleming補正では次式が用いられます。

$$
d\hat{H}_{HF}(t_{(j)}) = \frac{d_j – 0.5}{n_j}
$$

Nelson補正は分母を $n_j+1$ とすることで各増分を縮小し、$d_j/n_j$ と比較して $n_j$ が小さいほど相対的な補正量が大きくなります。Harrington-Fleming補正は分子を $d_j-0.5$ とする半整数補正であり、一種の連続性補正として機能します。どちらの補正も $n_j$ が大きい極限では通常のNelson-Aalen増分 $d_j/n_j$ に収束します。補正法間では推定値がわずかに異なるため、解析報告の際には使用した推定量の種類を明示する必要があります。大標本では補正効果はほぼ消滅するため、通常のNelson-Aalen推定量で十分です。また、いずれの補正を適用しても残留バイアスが完全には解消しないことに留意してください。補正の適用可否は標本サイズと打ち切り率を事前に確認した上で判断することが望まれます。小規模コホートや追跡期間の短い臨床試験では、補正の有無による推定値の差が実質的に意味をもつ場合があります。

生物統計・臨床試験での応用と推定量の選択基準

Cox比例ハザードモデルの適用には比例ハザード仮定の成立が前提となります。Nelson-Aalen推定量を用いたlog-logプロットによる視覚的診断が標準的な確認手順として用いられます。群 $g$ の累積ハザード推定量 $\hat{H}_g(t)$ に対し、$\log(\hat{H}_g(t))$ を縦軸、$\log(t)$ を横軸にプロットしたとき、2群の曲線が一定の間隔を保って並行であれば比例ハザード仮定が支持されます。曲線が交差または時間とともに収束・拡大する場合は時変ハザード比の存在が示唆され、仮定の違反が疑われます。ただし、log-logプロットはあくまで視覚的な診断手段であり、比例ハザード仮定を確定的に保証するものではありません。変動や有限標本での偶然変動を考慮した検定手法との併用が推奨されます。特に追跡期間が短いコホートでは、初期のlog-logプロットが不安定な形状を示すことがあり、追跡期間が十分なデータ範囲のみを解釈の対象とする配慮が必要です。

推定量の選択基準について整理します。記述目的(生存確率の図示・群間比較)とモデリング目的(Cox回帰の前処理・ベースライン推定)で適切な推定量が異なります。生存確率の記述や群間の比較を目的とする記述的解析ではKaplan-Meier推定量が標準的な選択です。累積ハザードの絶対量を報告する場合や比例ハザード仮定の診断を行う場合にはNelson-Aalen推定量が適しています。Cox回帰のベースライン生存関数を推定する際にはBreslow推定量が標準的に採用されます。累積ハザードの数値は生存確率ほど直感的でなく、$\hat{H}(t)=0.5$ が生存確率 $\exp(-0.5)\approx 0.61$ に対応するといった換算の明示が読者には有益です。患者100名あたりの期待イベント数として $100\times\hat{H}(t)$ を報告する方法が医学的解釈の補助に用いられることもありますが、この近似が成立するのは $\hat{H}(t)$ が小さい範囲に限られる点に注意が必要です。

生物統計学の実践例として、癌コホート研究における患者群別の累積死亡ハザードの推定があります。処置群と対照群の累積ハザード曲線をNelson-Aalen推定量で推定し、両曲線の差を量的に評価することで治療効果の大きさを記述できます。Cox回帰適用前にlog-logプロットで比例ハザード仮定を確認する手順は標準的な解析フローに組み込まれています。打ち切りが多く標本サイズが小さいコホートでは上方バイアスが顕在化するため、補正推定量の使用または解釈上の留意が求められます。なお、累積ハザードの数値解釈には追加説明が必要であり、読者の背景知識に応じた説明の補足が解析報告書の質を高めます。たとえば、$\hat{H}(t)=1.0$ を「時刻 $t$ までに1回分のイベントリスクが蓄積された」と記述し、対応する生存確率 $\exp(-1.0)\approx 0.37$ を並記することで、生存確率に慣れた読者にも内容が伝わります。累積ハザードを単独で報告する際には、このような換算値の提示が推奨されます。

推定量 推定対象 定義式の形 小標本バイアス 主な用途・推奨場面
Kaplan-Meier推定量 生存関数 $S(t)$ $\prod(1-d_j/n_j)$ 下方バイアス(小) 生存確率の記述・群間比較
Nelson-Aalen推定量 累積ハザード関数 $H(t)$ $\sum d_j/n_j$ 上方バイアス(補正で軽減) 累積ハザード報告・比例ハザード診断
Breslow推定量 ベースライン累積ハザード $H_0(t)$ Cox回帰文脈でのNA型増分の累積和 漸近的に一致(大標本) Cox回帰のベースライン生存推定
Log-log plot for proportional hazards assumption diagnostic showing parallel vs non-parallel curves

(Fig3. log($-$log $\hat{H}(t)$) プロットによる比例ハザード仮定の診断:並行ケースと非並行ケースの比較)

Popular Articles