階層データとGLMMの動機
多施設臨床試験では、患者が施設にネストされた階層データ構造が生じます。標準ロジスティック回帰は観測値のi.i.d.(独立同分布)条件を前提としますが、同一施設内の患者間にはクラスター内相関が存在するため、この条件が成立しません。独立性仮定の違反は固定効果の標準誤差を過小推定させ、第一種過誤率を名目水準よりも高くします。
クラスター内相関の強さはICC(クラスター内相関係数)で定量されます。ロジットリンクを用いたモデルでは、潜在変数の枠組みにおけるICCは次の関係で定義されます。
$$
\rho = \frac{\sigma^2_b}{\sigma^2_b + \pi^2/3}
$$
$\sigma^2_b$はクラスター間のベースライン差を表す変量効果の分散であり、$\pi^2/3$は標準ロジスティック分布の分散です。$\rho$が正であれば同一施設内の患者間に正の相関があり、標準ロジスティック回帰に基づく標準誤差は過小推定となります。ICCが0.05を超える場合、クラスター構造を無視した解析結果の信頼性は著しく低下します。
この問題に対処するのがGLMM(一般化線形混合モデル)です。GLMMは固定効果(集団共通のパラメータ)と変量効果(クラスター固有のパラメータ)を同時に組み込み、subject-specificな効果を明示的にモデル化します。変量効果を通じてクラスター内相関を構造的に吸収することで、標準誤差の過小推定を回避します。
GLMMの定式化
GLMMは応答の分布・線形予測子・変量効果分布の三層構造で構成されます。クラスター$i$の個体$j$に対する2値応答$Y_{ij}$について、変量効果$b_i$を所与とした条件付き分布は次式で定式化されます。
$$
\text{logit}\, P(Y_{ij}=1 \mid b_i) = X_{ij}’\beta + Z_{ij}’b_i
$$
$\beta$はすべてのクラスターに共通する固定効果係数ベクトルであり、集団全体の平均的な効果を記述します。$b_i$はクラスター$i$固有の変量効果ベクトルで、施設間のベースライン差や効果の異質性を吸収します。$X_{ij}$と$Z_{ij}$はそれぞれ固定効果・変量効果に対応する共変量ベクトルです。変量効果の分布には多変量正規分布が仮定されます。
$$
b_i \sim \mathcal{N}(0,\, G)
$$
$G$は変量効果の分散共分散行列で、対角成分が各変量効果の分散、非対角成分がそれらの共分散を表します。固定効果$\beta$と$G$の推定には、変量効果を積分消去した周辺尤度が用いられます。
$$
L(\beta, G) = \prod_{i} \int \prod_{j} f(y_{ij} \mid b_i;\, \beta)\, \phi(b_i;\, 0, G)\, db_i
$$
$f(\cdot)$はベルヌーイ分布の確率関数、$\phi(\cdot)$は多変量正規密度関数です。GLMMの条件付きモデルが記述するのはクラスター固有の効果であり、変量効果を積分消去した周辺分布はGEE(一般化推定方程式)が推定する集団平均的な効果に対応します。条件付き分布と周辺分布の区別は解釈において本質的な意味を持ちます。
GLMMの主要な仮定として、変量効果の正規性と、変量効果を所与としたときの観測値の条件付き独立性が挙げられます。変量効果の正規性が成立しない場合は推定量に偏りが生じ、条件付き独立性が成立しない場合はモデルの特定が不完全となります。
ランダム切片モデルとランダム傾きモデル
変量効果の構造は分析目的とデータの性質に応じて選択されます。ランダム切片モデルは変量効果をスカラー$b_i = b_{0i}$とし、分散構造を$G = \sigma^2_b$とします。
$$
\text{logit}\, P(Y_{ij}=1 \mid b_{0i}) = \beta_0 + \beta_1 x_{ij} + b_{0i}
$$
各クラスターの切片が$b_{0i}$だけシフトし、施設間のベースラインリスクの差が表現されます。共変量$x_{ij}$の効果$\beta_1$はすべてのクラスターで共通と仮定されます。ランダム切片の導入が必要かどうかは、ICCと分散成分$\sigma^2_b$の尤度比検定を組み合わせて判断します。ICCが0.05を超える場合や$\sigma^2_b$の尤度比検定が有意な場合は、ランダム切片の導入が支持されます。
(Fig1. ランダム切片モデルによる施設別ロジスティック曲線(各曲線が施設固有の切片を持ち平行シフトする))
ランダム傾きモデルでは切片と傾きの両方をクラスター固有とします。$b_i = (b_{0i},\, b_{1i})’$とおくと、分散共分散行列は次の$2\times 2$行列です。
$$
G = \begin{pmatrix} \sigma^2_{b_0} & \sigma_{b_0 b_1} \\ \sigma_{b_0 b_1} & \sigma^2_{b_1} \end{pmatrix}
$$
$\sigma^2_{b_1}$は処置効果の施設間異質性を定量し、$\sigma_{b_0 b_1}$はベースラインリスクと処置効果の共変動を表します。共分散項が正であれば、ベースラインリスクの高い施設ほど処置効果も大きい傾向を示します。分散共分散行列の構造は非構造化(全成分を自由推定)と対角行列(共分散項ゼロ)から選択します。ランダム傾きモデルはより豊かな変動構造を表現できますが、推定するパラメータ数が増加し、推定の安定性が低下します。クラスターサイズが小さい場合、ランダム傾きの分散推定は不安定となり、分散共分散行列が特異境界に近づく可能性が高まります。
推定法:Laplace近似と適応Gauss-Hermite求積
周辺尤度の積分はロジットリンクの非線形性により解析的に計算できません。主要な数値近似法として、Laplace近似とAGQ(適応Gauss-Hermite求積)があります。
Laplace近似では、各クラスターの積分核の負の対数をMAP推定量(最大事後確率点)周りでTaylor展開し、二次近似によって積分を正規分布型の解析的評価に帰着させます。Laplace近似は求積点数$n_\text{AGQ}=1$のAGQと等価です。変量効果分散$\sigma^2_b$が小さい場合には精度が高いですが、$\sigma^2_b$が増大すると積分核の対称性が損なわれ、二次近似の誤差が拡大してバイアスが生じます。
AGQは積分核の山の位置と形状に適応させた求積点と重みを用いて数値積分を実行します。求積点数$n_\text{AGQ}$を増やすほど近似精度が向上しますが、計算コストも増大します。特に$\sigma^2_b$が大きい領域でLaplace近似との精度差が顕著となります。
(Fig2. Laplace近似とAGQ(求積点数別)の対数尤度近似誤差。変量効果分散$\sigma^2_b$の増大に伴う精度の乖離を示す)
PQL(ペナルティ付き準尤度)は計算が速いですが、変量効果分散が大きい場合や応答確率が0または1に近い場合に固定効果推定に偏りが生じます。精度の観点からLaplace近似やAGQに劣ります。固定効果推定にはML(最大尤度法)を用い、変量効果分散の推定にはREML(制限最大尤度法)が選択肢となります。REMLは固定効果を消去した残差尤度を最大化するため変量効果分散の過小推定を軽減しますが、固定効果のモデル間比較には使用できません。AGQは変量効果の次元が高くなると求積点数が指数的に増大するため、多次元変量効果への適用は計算コストの観点から困難です。
条件付きオッズ比と周辺オッズ比
GLMMとGEEでは推定されるパラメータの意味が根本的に異なります。GLMMの固定効果$\beta_\text{GLMM}$は、同一クラスター内で共変量が1単位増加したときの条件付きオッズ比を与えます。
$$
\text{条件付きオッズ比} = \exp(\beta_\text{GLMM})
$$
これはsubject-specific解釈であり、特定の施設や個体に対するリスク変化を記述します。一方、GEEの固定効果$\beta_\text{GEE}$は集団全体の平均的なオッズ比を与えます。
$$
\text{周辺オッズ比} = \exp(\beta_\text{GEE})
$$
ロジットリンクの非線形性により、これら二つのオッズ比は一致しません。変量効果分散$\sigma^2_b$が正のとき、非崩壊性により次の関係が成立します。
$$
|\beta_\text{GLMM}| \geq |\beta_\text{GEE}|
$$
$\sigma^2_b$が増大するほど両者の乖離は拡大します。個人の予後予測にはsubject-specificな条件付きオッズ比を推定するGLMMが適切であり、集団全体への政策立案にはpopulation-averageな周辺オッズ比を推定するGEEが適切です。
(Fig3. 変量効果分散$\sigma^2_b$の増大に伴う条件付きオッズ比と周辺オッズ比の乖離(非崩壊性の可視化))
条件付きオッズ比の値は変量効果の分布(特に分散$\sigma^2_b$)に依存します。変量効果分布の仮定が誤っている場合、条件付きオッズ比の推定値も影響を受けます。
モデルの仮定・診断・限界
GLMMが適切に機能するためには、変量効果の正規性、誤差項の条件付き独立性、およびリンク関数の正確性という三つの主要仮定の成立が必要です。
変量効果の正規性はBLUP(最良線形不偏予測量)を用いて診断されます。BLUPは変量効果の経験ベイズ的な予測値であり、そのQ-Qプロットが直線から大きく逸脱する場合は正規性仮定の再検討が必要です。ただし、BLUPは真の変量効果に向けて縮小推定されているため、縮小の程度を考慮せずに正規性の判断に使用すると過信のリスクがあります。正規性仮定への感度評価には、$t$分布やガンマ分布を変量効果に仮定した代替モデルとの比較が有効です。
変量効果分散の推定値が境界値0に達する現象は特異境界と呼ばれ、モデルの過適合や変量効果構造の過大指定を示唆します。特異境界が検出された場合、そのモデル要素の必要性を再評価します。リンク関数の正確性については、ロジットリンクに代えてプロビットリンクを用いたモデルとの比較により評価できます。
変量効果の有意性検定にはLRT(尤度比検定)が用いられますが、帰無仮説が境界上($\sigma^2_b = 0$)にあるため、検定統計量は通常の$\chi^2$分布ではなく、点確率0と$\chi^2_1$分布を等比で混合した混合$\chi^2$分布に従います。$p$値は通常の$\chi^2$検定から得られる値の半分として補正します。影響点診断においては一施設を除外した感度分析を実施し、特定施設への結果の依存性を評価します。大規模データでは計算コストが高く、クラスター数が少ない場合は変量効果推定が不安定となります。
医療統計への応用とGEEとの比較
多施設ランダム化比較試験では、施設をクラスターとしたランダム切片モデルが広く用いられます。施設固有のベースラインリスクを変量効果$b_{0i}$として吸収することで、施設間の患者背景の違いや診療水準の施設差を制御した治療効果推定が可能となります。
施設間異質性の評価にはICCと設計効果を用います。設計効果DEFF(デザインエフェクト)は次式で概算されます。
$$
\text{DEFF} \approx 1 + (n_c – 1)\,\rho
$$
$n_c$は平均クラスターサイズ、$\rho$はICCです。DEFFが大きいほどクラスタリングによる有効サンプルサイズの減少が顕著であり、施設効果の制御が推論の妥当性に直接影響します。
モデル選択にはAIC(赤池情報量規準)またはBIC(ベイズ情報量規準)が用いられます。AICは予測精度、BICはモデル複雑性へのペナルティが大きく、いずれも変量効果構造の選択(ランダム切片のみ対ランダム傾き追加)に適用できます。ただし、これらの指標は参考値として用い、臨床的な文脈での判断と合わせて解釈することが求められます。施設サイズが極端に不均衡な場合、規模の大きい施設が変量効果分散の推定に支配的な影響を与え、偏りが生じる可能性があります。施設数が10未満の場合は変量効果分散の推定が不安定となり、Laplace近似の信頼性が低下するため、AGQ($n_\text{AGQ} \geq 5$)またはベイズ的アプローチへの切り替えを検討する必要があります。
| 特性 | 固定効果ロジスティック回帰 | GEE | GLMM |
|---|---|---|---|
| 推定対象 | 周辺(独立性仮定のもと) | 周辺(population-average) | 条件付き(subject-specific) |
| 相関の扱い | 無視 | 作業相関行列で近似 | 変量効果として構造化 |
| 推定法 | ML | 擬似尤度(GEE方程式) | 周辺尤度(Laplace/AGQ) |
| 係数の解釈単位 | 集団平均(相関無視のため標準誤差に注意) | 集団平均 | クラスター内・個体内 |
| 適用場面 | クラスター構造が無視できる場合 | 集団への政策立案・平均的効果の評価 | 個人予測・施設固有効果の推定 |
個人の予後予測を目的とする場合はGLMMが適切であり、集団全体への政策評価にはGEEが推奨されます。ベイズGLMMはGLMMの枠組みをベイズ推論へ拡張したものであり、事前分布の導入によって変量効果分散の推定が安定化し、施設数が少ない状況においても信頼性の高い推論が可能となります。

