マクネマー検定(McNemar test)は、対応のある二値データ(名義尺度データ)における比率の差を検証するための検定手法です。特に同一対象に対して2回の測定を行い、その結果が2×2分割表で整理できる場合に広く用いられます。例えば、ある治療の前後で症状が改善したか否かを同一患者で比較したり、診断方法AとBの結果が一致するかを同一被験者で比較する場面などに適しています。
この検定は、対応のない独立サンプルにおける比率の差を比較するカイ二乗検定とは異なり、同一対象を扱うため、対応の構造を考慮している点が特徴です。適切に利用することで、誤った帰無仮説の棄却や誤解を防ぐことができます。
マクネマー検定の概要
マクネマー検定は、次のような2×2分割表に基づいて行われます。ここでは、ある対象において条件1と条件2の二値結果を整理した場合を考えます。
| 条件2=陽性 | 条件2=陰性 | |
| 条件1=陽性 | a | b |
| 条件1=陰性 | c | d |
ここで、a, b, c, d は観測度数を示します。この表において、a と d は一致する結果(両方陽性、または両方陰性)であり、b と c は不一致の結果(条件1と条件2で異なる判定)を表します。マクネマー検定が焦点を当てるのは、この b と c の差です。すなわち、対応のある二値データの差を検証するために、不一致のセルのみを利用して検定を行います。
数式モデル
帰無仮説は「b と c の比率は等しい」、すなわち「条件1と条件2で陽性になる確率に差はない」となります。
- $ H_0 $:$ b = c $
- $ H_1 $:$ b \neq c $
マクネマー検定統計量は以下のように表されます。
標準的なマクネマー検定統計量は
$$ \chi^2 = \frac{(b-c)^2}{b+c} $$
により計算されます。これは自由度1のカイ二乗分布に従います。
ただし、b + c が小さい場合(一般的には25未満)には、連続性補正を施した式が推奨されます。
$$ \chi^2 = \frac{(|b-c|-1)^2}{b+c} $$
また、非常にサンプルサイズが小さい場合には、二項検定による正確検定(Exact McNemar test)が利用されます。この場合、帰無仮説の下で b は二項分布に従うとみなして検定を行います。
前提条件
マクネマー検定を適用する際には、いくつかの前提条件があります。
- データは同一対象から得られた対応のある二値データであること。
- 測定は独立していること(各対象間は互いに独立)。
- 分析対象は2×2のクロス表に整理可能な二値変数であること。
- サンプルサイズが十分に大きい場合にはカイ二乗近似が利用可能であること。
細分化された手法
- 標準的マクネマー検定:$ b+c $ が大きい場合に利用。
- 連続性補正付きマクネマー検定:サンプルサイズが小さい場合に利用。
- 正確マクネマー検定:二項検定を用いて小サンプルに対応。
- 拡張マクネマー検定:多値カテゴリに対する McNemar-Bowker 検定。
実例
実例1:治療前後の症状改善の有無(b=15, c=5)
実例2:診断方法AとBの一致度比較(b=20, c=10)
実例3:アンケート調査の前後比較(b=25, c=40)
効果量
マクネマー検定における効果量の代表例として、オッズ比が挙げられます。
$$ OR = \frac{b}{c} $$
このオッズ比の95%信頼区間は対数変換を用いて推定されます。
$$ \log(OR) \pm Z_{\alpha/2} \sqrt{\frac{1}{b} + \frac{1}{c}} $$
注意点
- サンプルサイズが小さい場合には正確検定を利用すること。
- 多重比較の際には補正を行うこと。
- 必ず2×2表に整理できるか確認すること。
- 効果量の解釈では信頼区間を重視すること。
- 不一致セルが極端に少ない場合には検定が不安定になる。
まとめ
マクネマー検定は、対応のある二値データにおける比率の差を検討するための有効な方法です。標準版、連続性補正付き、正確検定、拡張版といったバリエーションが存在し、データ特性に応じて適切に選択することが重要です。実際の研究や調査においては、効果量の解釈や多重比較の問題にも留意する必要があります。適切に用いることで、治療効果や診断方法の比較、教育効果の検証など、多岐にわたる分野で有用な結論を導くことができます。
