統計学において、複数の群間でデータの分布に差があるかどうかを比較する場面は非常に多く存在します。例えば、複数の薬剤を投与したグループ間での効果の違いを調べる場合や、異なる教育カリキュラムを受けた学生の成績分布を比較する場合などが典型例です。もしデータが正規分布(ガウス分布)に従い、群間の分散も等しいと仮定できるなら、分散分析(ANOVA)が用いられます。しかし、現実のデータは必ずしもそのような前提を満たすとは限りません。外れ値や非対称分布を含むことも多く、その場合にはノンパラメトリックな手法が必要になります。
その代表的な方法が「クラスカル・ウォリス検定(Kruskal-Wallis test)」です。これはウィルコクソンの順位和検定を三群以上に拡張したもので、群が2つのときはウィルコクソンの順位和検定と一致します。すなわち、クラスカル・ウォリス検定は、分布に対する強い仮定を必要とせず、データが順序尺度以上であれば適用できるという利点を持ちます。本稿では、この検定の理論的背景、数式モデル、前提条件、手順、効果量、実例、注意点を包括的に解説します。
クラスカル・ウォリス検定の概要
クラスカル・ウォリス検定は、k個(k ≥ 3)の独立した群間で、分布が同一であるかどうかを検定する方法です。帰無仮説は「すべての群の分布が同じ」であり、対立仮説は「少なくとも1つの群の分布が異なる」となります。この検定はデータを順位に変換し、その順位の分布が群間で偏りなく現れるかを検討するものです。
- 帰無仮説:すべての群の分布が同じ
- 対立仮説:少なくとも1つの群の分布が異なる
ANOVAが平均値の差を直接検定するのに対し、クラスカル・ウォリス検定は順位に基づいて「中央値付近を中心とした分布全体の違い」を検出します。そのため、外れ値の影響を受けにくく、分布の正規性が満たされない場合に有効です。
数式モデル
観測値を以下のように定義します。
- 群の数:$ k $
- 群 $ i $ のサンプルサイズ:$ n_i $
- 全体のサンプルサイズ:$ N=\sum_{i=1}^k n_i $
- 群 $ i $ の観測値:$ X_{i1},X_{i2},…,X_{in_i} $
- 群 $ i $ の順位和:$ R_i $
検定統計量 $ H $ は次のように定義されます。
$$ H = \frac{12}{N(N+1)} \sum_{i=1}^k \frac{R_i^2}{n_i} – 3(N+1) $$
十分に大きなサンプルサイズがある場合、$ H $ は自由度 $ k-1 $ のカイ二乗分布に従うと近似されます。
$$ H \sim \chi^2_{k-1} $$
前提条件
- 測定尺度が順序尺度以上であること
- 群が互いに独立していること
- 各群内の観測値が独立していること
- 母集団分布の形は同一であること
手順
- すべての群の観測値を一つの集合にまとめる。
- すべての観測値に順位を付ける(同順位は平均順位を割り当てる)。
- 各群の順位の合計 $ R_i $ を求める。
- 検定統計量 $ H $ を計算する。
- 自由度 $ k-1 $ のカイ二乗分布を用いてp値を求める。
- 有意水準と比較して帰無仮説を棄却するかどうかを判断する。
効果量
代表的な効果量は以下の通りです。
- $ \eta^2 = \frac{H}{N-1} $
- $ \epsilon^2 = \frac{H-k+1}{N-k} $
これらの値は0から1の範囲を取り、1に近いほど効果が大きいことを意味します。
事後解析
有意差が認められた場合、二群間比較に戻り、ウィルコクソンの順位和検定やマン・ホイットニーU検定を行い、多重比較補正(Bonferroni補正やFDR補正など)を適用します。
実例
- 医学研究:三種類の降圧薬A群(n=20)、B群(n=20)、C群(n=20)の投与後の血圧変化を比較する。
- 教育研究:授業法(従来型、グループディスカッション型、eラーニング型)の成績分布を比較する。
- 産業分野:三つの工場で製造された製品の品質スコアを比較する。
注意点
- 中央値の差を直接検定しているのではなく、群全体の順位分布に偏りがあるかを検定している。
- 分布の形が異なる場合、有意性は分布形状の差を反映する可能性がある。
- 多重比較を行う際には必ず補正を行う必要がある。
- 効果量を併せて報告することが望ましい。
まとめ
クラスカル・ウォリス検定は、三群以上の独立した群間で分布の差を検討する際に有効なノンパラメトリック検定です。データが正規分布を満たさない場合や順序尺度データしか得られない場合に特に有用であり、実務や研究において頻繁に利用されます。検定の結果に有意差が出た場合には、必ず事後解析を行って群間の差を具体的に明らかにする必要があります。
