統計学における手法は大きく分けてパラメトリック手法とノンパラメトリック手法に分類されます。パラメトリック手法は、母集団(全体のデータ分布)が特定の分布に従うという仮定を前提とし、その分布のパラメータを推定して検定や推定を行います。一方、ノンパラメトリック手法は分布に強い仮定を置かず、順位情報や分布の形に依存しない方法を用いて解析を行います。両者はそれぞれの特徴に基づいて使い分ける必要があり、研究の設計やデータ特性に応じて適切に選択しなければなりません。
本稿では、まずパラメトリック手法とノンパラメトリック手法の定義を明確にし、それぞれの代表的な手法と数式モデル、前提条件を示します。さらに両者の比較、効果量の扱い、そして実例を交えて詳しく解説していきます。最後に、研究者が実際にデータ解析を行う際に直面する選択の難しさや注意点についても整理します。
パラメトリック手法
パラメトリック手法は、母集団の分布が正規分布(ガウス分布)など特定の確率分布に従うと仮定し、その分布を特徴づける有限個のパラメータ(平均、分散など)を推定することで解析を行います。
前提条件
パラメトリック手法には共通して次のような前提条件があります。
- 母集団が特定の分布(多くの場合は正規分布)に従うこと
- 各観測が独立であること
- 群間比較では分散が等しい(等分散性)こと
これらの条件が満たされていない場合、推定値や検定結果が偏ってしまい、誤った結論を導く可能性があります。
数式モデル
例えば1標本t検定における数式モデルは次の通りです。
$$ t = \frac{\bar{X} – \mu_0}{s / \sqrt{n}} $$
- $ \bar{X} $ :標本平均
- $ \mu_0 $ :帰無仮説での母平均
- $ s $ :標本標準偏差
- $ n $ :サンプルサイズ
このt値がt分布に従うことを利用して、有意差の有無を判定します。
代表的なパラメトリック手法
- t検定(1標本t検定、2標本t検定、対応のあるt検定、Welchのt検定)
- 分散分析(ANOVA、反復測定ANOVA、混合効果モデル)
- 回帰分析(単回帰分析、重回帰分析、線形モデル)
- 相関分析(ピアソンの相関係数)
効果量
パラメトリック手法では効果量の計算が容易であり、研究において重要な情報を与えます。
- Cohen’s d(平均差を標準偏差で割った値)
- Hedges’ g(Cohen’s dの小標本補正版)
- $ \eta^2 $(分散分析における効果量)
- $ R^2 $(回帰分析における説明率)
ノンパラメトリック手法
ノンパラメトリック手法は、母集団分布に関して強い仮定を必要としない方法です。特に正規性が疑わしい場合や、サンプルサイズが小さい場合に有効です。
前提条件
ノンパラメトリック手法の前提条件は比較的緩やかです。
- 母集団分布についての仮定が不要
- データの独立性は必要
- 順位データやカテゴリーデータにも適用可能
数式モデル
ノンパラメトリック手法は多くの場合、順位に基づいて統計量を構築します。例えばマン・ホイットニーのU検定の統計量は次のように表されます。
$$ U = n_1 n_2 + \frac{n_1 (n_1 + 1)}{2} – R_1 $$
- $ n_1 , n_2 $ :各群のサンプルサイズ
- $ R_1 $ :群1の順位和
この統計量を用いて、有意差の有無を判定します。
代表的なノンパラメトリック手法
- Mann-Whitney U検定(独立2群の比較)
- Wilcoxon符号付順位検定(対応のある2群の比較)
- Kruskal-Wallis検定(独立3群以上の比較)
- Friedman検定(対応のある3群以上の比較)
- Spearmanの順位相関係数、Kendallの順位相関係数
効果量
ノンパラメトリック手法でも効果量を計算できます。
- $ r $(Z値をサンプルサイズに基づいて換算した相関係数)
- Cliff’s delta(2群間の優越確率を示す指標)
- $ \eta^2 $(順位データに基づく分散比から算出)
パラメトリックとノンパラメトリックの比較
両者の使い分けは重要です。
- データが正規分布に従い、サンプルサイズも十分 → パラメトリック手法
- データが偏っている、外れ値が多い、サンプルサイズが小さい → ノンパラメトリック手法
また、パラメトリック手法の方が検出力(真の差を見つける力)が高いため、前提条件を満たしている場合はパラメトリック手法を優先するのが一般的です。
実例
実例1
教育現場で新しい学習方法の効果を検証するために、30名の生徒を対象にテストを行った場合、得点が正規分布に近いと判断できれば対応のあるt検定を用いることができます。しかし、データに著しい偏りがある場合はWilcoxon符号付順位検定を用いるべきです。
実例2
臨床研究で2種類の薬の効果を比較する場合、サンプルサイズが大きくてデータが正規性を満たしているなら独立2標本t検定が適切です。一方、サンプル数が少なく分布が歪んでいる場合はMann-Whitney U検定を使います。
実例3
マーケティング調査で複数の広告手法の効果を比較する場合、売上データが正規分布を仮定できればANOVAを使えます。分布が非正規であればKruskal-Wallis検定で分析する方が安全です。
まとめ
パラメトリック手法とノンパラメトリック手法は、それぞれの前提条件や適用場面に応じて使い分ける必要があります。正規性や等分散性が担保される場合にはパラメトリック手法を優先し、そうでない場合にはノンパラメトリック手法が有効です。効果量を併用することで、統計的有意性だけでなく実質的な大きさを把握することも重要です。

