Top 5 This Week

関連記事

16. GLMの交互作用:効果修飾と調整効果の検定

- 本サイト運営者のサービスの紹介 -

交互作用の基礎と動機

一般化線形モデルGLMにおいて、複数の説明変数が目的変数に与える効果を評価する際、ある変数の効果が他の変数の水準によって変化する場合があります。この現象を統計的交互作用と呼びます。

主効果のみのモデルでは、線形予測子は次の形式で表されます。

$$\eta = \beta_0 + \beta_1 X_1 + \beta_2 X_2$$

この定式化は加法性を仮定しており、$X_1$の効果は$X_2$の値に関わらず一定です。しかし、ある治療薬の効果が患者の性別によって体系的に異なる場合のように、この仮定が成立しない状況は実際の研究で観察されます。交互作用項を導入した線形予測子の一般形は以下となります。

$$\eta = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_1 X_2$$

ここで$\beta_3$が交互作用効果を表すパラメータであり、$X_1$の効果が$X_2$の値によってどの程度変化するかを定量化します。GLMにおける交互作用の対称性として$X_1 \times X_2 = X_2 \times X_1$が成立するため、どちらの変数を修飾変数として位置づけるかは数学的に等価です。

統計的交互作用と生物学的交互作用は概念的に区別される必要があります。統計的交互作用はモデルのパラメータとして定義される量であり、採用するリンク関数と評価尺度によって異なる結論が導かれる場合があります。生物学的交互作用は生体内の共同作用を指す概念であり、両者が常に対応するわけではありません。前提として、積項は線形予測子に加法的に導入されること、および$X_1 \times X_2 = X_2 \times X_1$の対称性が成立することが仮定されます。交互作用の解釈がリンク関数の定める尺度に依存するという点が、この分析の本質的な制約です。

乗法的スケールと加法的スケールの交互作用

GLMにおける交互作用の解釈は、採用するリンク関数と評価尺度によって本質的に異なります。乗法的スケールでの交互作用の不在と加法的スケールでの交互作用の不在は非等価であり、一方の尺度で$\beta_3 = 0$であっても、他方の尺度では交互作用が存在することがあります。

ロジスティック回帰(logitリンク)における乗法的スケールの交互作用は、交互作用係数$\beta_3$の指数変換として定義されます。

$$\text{OR}_\text{interaction} = \exp(\beta_3)$$

これは、修飾変数$Z$の水準が変化したときに曝露$X$のオッズ比が乗法的にどの程度変化するかを示します。ポアソン回帰(logリンク)においても同様に、乗法的スケールの交互作用はリスク比の比として定義されます。

$$\text{RR}_\text{interaction} = \exp(\beta_3)$$

logリンクとlogitリンクはいずれも乗法的スケールでの交互作用を$\exp(\beta_3)$として表現しますが、絶対リスク差スケールへの含意は互いに異なります。

恒等リンクを用いた線形リスクモデルでは、交互作用をリスク差スケールで直接表現できます。このモデルの線形予測子は以下の形式となります。

$$P(Y=1 \mid X, Z) = \beta_0 + \beta_1 X + \beta_2 Z + \beta_3 XZ$$

係数$\beta_3$はリスク差スケールの加法的超過リスクを直接表します。$X=1$かつ$Z=1$のときに観測されるリスクから、$X$の主効果($\beta_1$)と$Z$の主効果($\beta_2$)の和から加法的に予測されるリスクを引いた差が$\beta_3$に等しいです。$\beta_3 = 0$はリスク差スケールでの交互作用の不在を意味します。

疫学研究では加法的スケールの交互作用評価にRERI(相対超過リスク)が広く用いられます。$RR_{11}$を$X=1$かつ$Z=1$、$RR_{10}$を$X=1$かつ$Z=0$、$RR_{01}$を$X=0$かつ$Z=1$の場合のリスク比(基準群は$X=0, Z=0$)として、REIRは次のように定義されます。

$$\text{RERI} = RR_{11} – RR_{10} – RR_{01} + 1$$

$\text{RERI} = 0$が加法的交互作用の不在、$\text{RERI} > 0$が正の加法的相乗性(超加法性)を示します。

AP(帰属割合)は、両曝露が同時に存在する集団($X=1$かつ$Z=1$)における疾病リスクのうち、二曝露間の相乗的交互作用に帰属する割合を定量化する疫学的指標です。

$$AP = \frac{\text{RERI}}{RR_{11}}$$

$AP > 0$は、両曝露群で観測されるリスクの一部が各曝露の単独効果の和では説明されず、二曝露の相乗作用によってもたらされることを意味します。

SI(相乗性指数)は、各曝露の単独効果(基準群を超える超過リスク)を合算した値に対して、両曝露の組み合わせがもたらす超過リスクの比率を表す疫学的指標です。

$$SI = \frac{RR_{11} – 1}{(RR_{10} – 1) + (RR_{01} – 1)}$$

$SI > 1$は超加法的な相乗性を示し、両曝露の組み合わせが各単独効果の和を超過することを意味します。$SI < 1$は拮抗的な関係を、$SI = 1$は厳密な加法性を示します。公衆衛生的介入において加法的尺度の交互作用が重要視される理由は、絶対リスク差が予防可能な症例数と直接対応し、介入戦略の優先順位付けに資するためです。

一方の尺度で交互作用が存在しなくても他方の尺度では存在しうること、およびどちらの尺度を採用するかは研究目的とモデルファミリーに依存することが、この領域の本質的な制約です。

GLMファミリー リンク関数 乗法的スケールの交互作用指標 加法的スケールの交互作用指標 $\exp(\beta_3)$ の意味
二項(ロジスティック) logit オッズ比の比 RERI, AP, SI 修飾変数水準の変化に伴うオッズ比の乗法的変化率
ポアソン log リスク比の比 RERI(ポアソン近似), AP, SI 修飾変数水準の変化に伴うリスク比の乗法的変化率
二項(線形リスク) identity (加法的モデルに不適) リスク差の差($\beta_3$直読) 加法的超過リスク($\beta_3 = 0$が加法的交互作用の不在)
乗法的スケールと加法的スケールにおける交互作用の非等価性

(Fig1. 乗法的スケールと加法的スケールにおける交互作用の非等価性(ロジスティック回帰シミュレーション)。左パネルでは対数オッズスケールで二群の線が平行($\beta_3 = 0$)ですが、右パネルの確率スケールでは非平行となり、加法的交互作用が存在することが示されます。)

効果修飾:定義・疫学的意義・交絡との区別

効果修飾者とは、曝露効果の大きさまたは方向を変える変数であり、研究目的において記述・報告すべき対象となります。層別解析では、効果修飾が存在する場合に層ごとの効果推定値が異なって示されます。層$l \in \{0, 1\}$ごとの線形予測子は

$$g(\mu_l) = \beta_{0l} + \beta_{1l} X$$

と表され、$\beta_{1l}$が層によって異なる値を取ります。交互作用項$\beta_3$を含む単一モデルはこの層別モデルと数学的に等価であり、$\beta_3$は両層間の効果の差として解釈されます。層別解析として広く用いられるMantel-Haenszel法による層別オッズ比の推定と、交互作用項を含む単一モデルによる推定は、同一の情報を異なる形式で表現する関係にあります。

定量的交互作用は、曝露効果の大きさのみが層間で変化する場合を指します。定性的交互作用は効果の方向が逆転する場合(ある層では有益、別の層では有害)を指し、臨床的に特に重要な意味をもちます。

効果修飾と交絡は根本的に異なる概念です。交絡は曝露とアウトカムの双方と関連する第三の変数が引き起こす偏りであり、解析において制御・除去すべき対象です。一方、効果修飾は真の現象であり、研究目的に応じて記述・報告すべき対象となります。交互作用なし調整モデル(主効果のみ)では、効果修飾者が存在する場合に層別の効果量が単一のパラメータに平均化され、層ごとの効果の異質性が隠蔽されます。

効果修飾者は研究目的に応じて事前に指定することが必要な要件です。観察研究では交絡の制御が不完全なため、観察された効果修飾が真の交互作用であるか交絡に起因するものかの区別が困難になる場合があります。事後的なサブグループ解析から効果修飾を推論することは多重比較の問題を内包し、偽陽性の結論をもたらす危険性があります。

交互作用項の定式化とパラメータ解釈

GLMに交互作用項を組み込む形式は、変数の型の組み合わせによって異なります。連続変数$X$と二値カテゴリ変数$Z \in \{0, 1\}$の交互作用を含む線形予測子は以下のように表されます。

$$g(\mu) = \beta_0 + \beta_1 X + \beta_2 Z + \beta_3 (X \cdot Z)$$

$Z = 0$の群における$X$の効果は$\beta_1$であり、$Z = 1$の群では$\beta_1 + \beta_3$となります。したがって$\beta_3$は「効果の差」として解釈されます。

カテゴリ変数同士の交互作用($2 \times 2$設計)では、基準セル(例えば$X = 0, Z = 0$)を定義したうえで、残る3セルに対してパラメータが割り当てられます。基準カテゴリの選択によって各パラメータの数値は変化しますが、モデルの予測値や適合度は不変です。

連続変数同士の交互作用では多重共線性の増大が生じやすいです。変数を平均中心化することで対処できます。$X^* = X – \bar{X}$と置換すると、主効果係数$\beta_1$の解釈が「$Z$の平均値における$X$の効果」に変化し、解釈可能性が向上します。ロジスティック回帰での交互作用係数の解釈として、$\exp(\beta_3)$は条件付きオッズ比の変化率(オッズ比の比)を意味し、この解釈は線形予測子の積項が交互作用効果を完全に捉えるという仮定のもとで成立します。高次元交互作用(3因子以上)はパラメータ数を急増させ、解釈の困難を招きます。連続変数同士の交互作用係数はスケールの選択に強く依存するため誤解されやすく、解釈の際には変数の単位と中心化の有無を明示することが求められます。

交互作用の統計的検定:尤度比検定とWald検定

交互作用項の統計的有意性を評価するために、主に尤度比検定とWald検定が用いられます。帰無仮説は$H_0: \beta_3 = 0$(交互作用なし)であり、交互作用なし(制約)モデルと交互作用あり(完全)モデルのネストモデル比較として定式化されます。

尤度比検定統計量は以下のように定義されます。

$$D = -2(\log L_\text{reduced} – \log L_\text{full})$$

この統計量は大標本のもとで、交互作用項の数を自由度とするカイ二乗分布に漸近します。Wald検定統計量は以下の形式で表されます。

$$W = \frac{\hat{\beta}_3^2}{\widehat{\text{Var}}(\hat{\beta}_3)}$$

大標本のもとで$\chi^2(1)$分布に漸近します。型IIIカイ二乗検定は、他の効果を調整したうえで各効果の独立した寄与を評価する枠組みであり、主効果と交互作用項のそれぞれへの寄与を分離して評価する際に用いられます。

交互作用検定の検出力は主効果検定の約25%程度になるという経験則があります。主効果の検出に十分な標本サイズであっても、交互作用効果の検出には約4倍の標本サイズが必要となります。両検定はいずれも漸近正規性(十分な標本サイズ)を前提とし、モデルのネスト構造(制約モデルが完全モデルの特殊ケースとして包含される関係)が成立していなければなりません。統計的有意性と臨床的・実質的重要性は一致しない場合があり、有意な$\beta_3$であっても効果量が小さければ実質的意義は限定的となります。事後的に探索された交互作用は多重比較として扱い、Bonferroni補正等による調整が必要であり、標本サイズ不足による検出力の問題と合わせて報告することが求められます。

マージナル効果と条件付き効果の計算

交互作用項を含むGLMでは、非線形リンク関数のもとでマージナル効果が観測値に依存するため、「$X$の効果」を単一の値で要約することはできません。

平均マージナル効果AMEは以下のように定義されます。

$$\text{AME} = \frac{1}{n} \sum_{i=1}^{n} \frac{\partial E[Y \mid X_i, Z_i]}{\partial X}$$

各観測値での偏微分を計算し平均することで、標本全体を代表する単一の効果量を算出します。平均値点マージナル効果MEMは$X$と$Z$をそれぞれの標本平均値$(\bar{X}, \bar{Z})$に固定して偏微分を評価します。

$$\text{MEM} = \left.\frac{\partial E[Y \mid X, Z]}{\partial X}\right|_{X=\bar{X},\, Z=\bar{Z}}$$

AMEとMEMは非線形モデルでは一般に一致しません。マージナル効果の標準誤差はDelta法によって近似計算されます。$f(\boldsymbol{\beta})$をマージナル効果の関数とすると、

$$\widehat{\text{Var}}(\text{AME}) \approx \left(\frac{\partial f}{\partial \boldsymbol{\beta}}\right)^\top \widehat{\text{Var}}(\hat{\boldsymbol{\beta}}) \left(\frac{\partial f}{\partial \boldsymbol{\beta}}\right)$$

として分散が近似されます。交互作用が存在する場合は、修飾変数$Z$の各水準における条件付き効果を個別に計算・提示することが推奨されます。予測値プロットは、異なる$Z$水準での$X$に対する予測アウトカムの変化を視覚化する際に有用です。実用上の報告では、研究目的に応じて条件付き効果とAMEのいずれを選択するかを事前に決定し、明示することが必要です。期待値操作と観測値の代入可能性が前提となっていること、および交互作用を含む場合は単一の効果量でXとYの関係を要約できない点が本アプローチの制約となります。AMEは対象集団の特性に依存するため、他の集団への汎化には限界があります。

連続変数×二値修飾変数の交互作用を示すグループ別予測確率曲線と95%信頼帯

(Fig2. 連続変数×二値修飾変数の交互作用:グループ別予測確率曲線と95%信頼帯。$Z = 0$と$Z = 1$の群で傾きが異なり、曲線が交差することで定性的交互作用の存在が示されます。)

医療統計への応用と解釈上の注意点

治療効果の異質性HTEとは、治療効果の大きさまたは方向が患者の特性(年齢・性別・疾患重症度等)によって異なる現象を指し、GLMの交互作用項を用いてモデル化されます。ランダム化比較試験RCTにおいて、新薬の有効性が患者背景によって異なるかどうかを評価するために、治療群を示す変数と患者特性変数との交互作用項が線形予測子に組み込まれます。

確証的なサブグループ解析を実施するには、事前にサブグループ変数と交互作用の方向性をプロトコルに明記し、試験登録時に事前登録することが必須の要件となります。ICH E9(R1)ガイドラインは、事前指定されていない治療−共変量交互作用の解析を探索的として位置づけており、確証的エビデンスとしては扱わないことを求めます。

因果推論の枠組みにおける条件付き平均処置効果CATEは、各共変量水準において定義される因果的処置効果であり、交互作用項を通じたHTEの統計的推定と概念的に対応します。ただし、確証的サブグループ解析は事前指定と事前登録が必須であることが前提となります。

観察研究では交絡の制御が不完全なため、観察された交互作用が真のHTEではなく残余交絡に起因する偽の交互作用である可能性が否定できません。サブグループ解析の多重比較問題により、事後的に探索された交互作用の検定結果は仮説生成として位置づけるべきであり、確証的な結論として解釈することは適切ではありません。また、臨床試験は通常、主効果の検出に対して検出力が設計されており、サブグループ間の交互作用検定に対しては検出力が不足した状態にあります。これらの制約を踏まえ、交互作用解析の結果は効果量・信頼区間・検出力の評価とともに報告することが求められます。

サブグループ別の条件付き効果を示すForest plot(ORと95%信頼区間)

(Fig3. サブグループ別の条件付き効果:効果修飾のForest plot(ORと95%信頼区間)。サブグループ間での効果量の異質性を視覚化し、定量的・定性的交互作用の区別を示します。交互作用検定のp値が図内に注記されています。)

Popular Articles