コクランのQ検定(Cochran’s Q test)は、対応のある三つ以上の二値データ(名義尺度データ)において、各条件の間で陽性(または「はい」などのカテゴリ1)の比率が等しいかどうかを検定するための統計手法です。すなわち、同一の対象に対して複数の測定や判断を行い、それらの間に有意な違いがあるかを調べる際に用いられます。
マクネマー検定が2条件の対応ある二値データの比較に用いられるのに対して、コクランのQ検定はその多群版に相当します。三つ以上の対応条件間で比率の差を検討できることから、心理学、医学、教育学、社会学など、観察単位が同一のまま複数の試行・判定を行う研究でしばしば利用されます。
コクランのQ検定の基本原理
Cochran(1950)によって提案されたこの検定は、対応のあるデータにおける繰り返し測定の構造を保持しつつ、各条件での「成功(1)」または「失敗(0)」の割合に違いがあるかを評価するノンパラメトリック検定(母集団分布に仮定を置かない手法)です。対応のない比率の比較ではカイ二乗検定が使われますが、コクランのQ検定は対応があるという点で根本的に異なります。
具体的には、同じ被験者に対して複数の測定(例:3種類の治療、3種類のテスト、3つの観察時点など)を行い、それぞれについて「成功」「失敗」「陽性」「陰性」といった二値結果を記録します。そして、これらの条件間で成功率(1の割合)がすべて等しいかどうかを検定します。
数式モデル
n人の被験者があり、各被験者に対してk個の条件(試行)が与えられているとします。各被験者i(i=1,…,n)における条件j(j=1,…,k)の結果を次のように表します。
\[
x_{ij} =
\begin{cases}
1 & \text{成功または陽性の場合} \\
0 & \text{失敗または陰性の場合}
\end{cases}
\]
ここで、
- n:被験者数
- k:条件(試行)数
- \(x_{ij}\):被験者iの条件jにおける結果
各条件ごとの成功回数を次のように表します。
\[
C_j = \sum_{i=1}^{n} x_{ij}
\]
また、各被験者における成功回数の合計を次のように表します。
\[
R_i = \sum_{j=1}^{k} x_{ij}
\]
このとき、コクランのQ検定統計量は次のように定義されます。
\[
Q = \frac{(k-1)\left[k\sum_{j=1}^{k} C_j^2 – \left(\sum_{j=1}^{k} C_j\right)^2\right]}{k\sum_{i=1}^{n} R_i (k – R_i)}
\]
このQ統計量は、帰無仮説(全ての条件で成功率が等しい)が成り立つ場合、自由度(k−1)のカイ二乗分布に従います。
\[
H_0: p_1 = p_2 = \cdots = p_k
\]
\[
H_1: p_j \text{のいずれかが異なる}
\]
前提条件
- 各被験者は全ての条件に対して観測されていること(完全な対応データであること)。
- 各条件の結果は二値(0または1)であること。
- 各被験者間は独立であること。
- 各条件内で観測は独立であること。
他の検定との関係
コクランのQ検定は、マクネマー検定の一般化と位置づけられます。条件数が2(k=2)の場合、コクランのQ検定はマクネマー検定と全く同じ結果になります。また、連続データの対応3群以上の比較にはフリードマン検定(Friedman test)が用いられ、二値データの場合にはコクランのQ検定が対応します。
検定手順
- 各被験者について、k個の条件それぞれの結果を0または1で整理する。
- 各条件ごとに成功回数 \(C_j\) を算出する。
- 各被験者ごとに成功回数 \(R_i\) を算出する。
- 統計量 \(Q\) を求める。
- 自由度(k−1)のカイ二乗分布を用いてp値を算出する。
- 有意水準αと比較し、帰無仮説を棄却するか判断する。
事後検定
コクランのQ検定で有意差が得られた場合、各条件間のペア比較を行う必要があります。この際に用いられるのがマクネマー検定です。すべてのペアに対してマクネマー検定を実施し、Bonferroni補正やHolm補正などで多重比較補正を行います。
効果量
コクランのQ検定の効果量には、η²(エータ二乗)に類似した指標を用いることができます。
\[
\eta^2 = \frac{Q}{Q + n(k-1)}
\]
- η² ≈ 0.01:小さい効果
- η² ≈ 0.06:中程度の効果
- η² ≈ 0.14:大きい効果
実例
- 実例1:医薬品A・B・Cの有効性比較
30人の患者に対して3種類の薬剤A、B、Cを使用し、効果があったかどうか(0/1)を比較する。 - 実例2:広告デザインの効果比較
100人に3種類の広告を提示し、「購入したい」(1/0)反応率の差を検定する。 - 実例3:教育プログラム前後の理解度変化
50人の学生に3時点で理解度(はい=1, いいえ=0)を調査し、変化を検定する。
拡張手法
- 欠損データ:欠損がある場合、完全データのみを対象とするか、多重代入で補完してから解析する。
- 多値カテゴリ:二値データに限定されるQ検定を拡張する方法として、Bowkerの対称性検定や一般化Q検定がある。
- 反復測定ロジスティック回帰:より柔軟な解析にはGLMMやGEEを用いたロジスティック回帰が利用可能。
注意点
- 二値データのみ適用可能。
- 完全データである必要がある。
- 効果量が小さい場合、実質的な差は小さい可能性がある。
- 条件数が多いと多重比較補正の影響で有意差が出にくい。
- 対応構造を無視して独立サンプルのカイ二乗検定を行うのは誤り。
まとめ
コクランのQ検定は、対応のある三つ以上の二値データにおける比率差を評価するためのノンパラメトリック検定です。条件数が2の場合にはマクネマー検定に一致し、条件数が3以上の場合にはフリードマン検定の二値版として機能します。
医療試験、行動科学、教育評価、社会調査など幅広い分野で利用され、前提条件の確認・欠損処理・事後検定・効果量報告が重要です。現代では、Q検定を初期確認として実施し、続いてGEEや混合効果モデルで再検証する階層的分析が推奨されています。
