2026年 2月 25日 水曜日

Top 5 This Week

Related Posts

5.2 分散分析(ANOVA)と共分散分析(ANCOVA)


統計学における平均値の比較手法の代表格としてANOVA(Analysis of Variance、分散分析)があり、複数群間の平均値の差を検討する際に広く活用されています。一方で、データにはしばしば研究対象に直接含めたい要因とは別に、従属変数に影響を与える共変量(covariate、統計的に制御すべき連続変数)が存在します。そのような場合に用いられるのがANCOVA(Analysis of Covariance、共分散分析)です。ANCOVAはANOVAの拡張であり、群間比較に加えて共変量の影響を統制することによって、要因の純粋な効果を検討できる手法です。

本稿では、まずANOVAの理論的枠組みと実用的な側面を詳細に解説し、その後にANCOVAのモデル、適用方法、前提条件、効果量、実例を詳しく紹介します。最終的に両者の相違点や使い分けの指針を提示し、研究者が実際のデータ解析でどのように活用すべきかを明らかにします。

ANOVAの基本的枠組み

ANOVAの目的は、従属変数(dependent variable、研究対象となる数値データ)の平均値が群間で有意に異なるかどうかを調べることです。ANOVAはt検定を一般化した手法であり、2群比較に加えて3群以上の比較が可能である点に大きな強みがあります。

ANOVAの基本モデルは以下のように表されます。

$$ Y_{ij} = \mu + \tau_i + \epsilon_{ij} $$

  • $ Y_{ij} $ :i群のj番目の観測値
  • $ \mu $ :全体平均
  • $ \tau_i $ :i群の効果
  • $ \epsilon_{ij} $ :誤差項(平均0、分散$ \sigma^2 $の正規分布に従う)

データの変動は、全変動(総平方和SST)を群間平方和(SSB)と群内平方和(SSW)に分解することで解析されます。

全平方和(SST):

$$ SST = \sum_{i=1}^{k}\sum_{j=1}^{n_i}(Y_{ij} – \bar{Y})^2 $$

群間平方和(SSB):

$$ SSB = \sum_{i=1}^{k} n_i(\bar{Y}_i – \bar{Y})^2 $$

群内平方和(SSW):

$$ SSW = \sum_{i=1}^{k}\sum_{j=1}^{n_i}(Y_{ij} – \bar{Y}_i)^2 $$

F統計量は以下のように計算されます。

$$ F = \frac{MSB}{MSW} = \frac{SSB/(k-1)}{SSW/(N-k)} $$

ここで、kは群数、Nは総サンプルサイズです。Fが大きいほど群間差が有意である可能性が高くなります。

ANOVAの前提条件

  • 独立性:各群の観測値は互いに独立である。
  • 正規性:各群のデータは正規分布に従う。
  • 等分散性:各群の母分散が等しい。違反が疑われる場合はWelchのANOVAを使用する。

ANOVAの種類

  • 一元配置分散分析:1つの要因の水準に基づいて群を分け、平均値を比較する。
  • 二元配置分散分析:2つの要因を扱い、主効果と交互作用を同時に評価する。
  • 反復測定分散分析:同一被験者に繰り返し測定を行い、時間的変化や条件の影響を評価する。
  • 混合計画分散分析:被験者間要因と被験者内要因を組み合わせた設計を分析する。
  • 多変量分散分析(MANOVA):従属変数が複数存在する場合に適用される。
  • WelchのANOVA:等分散性が成り立たない場合の頑健な手法。

ANOVAの効果量

η²(イータ二乗):

$$ \eta^2 = \frac{SSB}{SST} $$

部分η²(partial η²):要因ごとに分けた効果量。

ω²(オメガ二乗):母集団効果量のより良い推定。

$$ \omega^2 = \frac{SSB – (k-1)MSW}{SST + MSW} $$

Cohenのf:

$$ f = \sqrt{\frac{\eta^2}{1-\eta^2}} $$

ANCOVAの基本的枠組み

ANCOVAは、ANOVAの拡張であり、従属変数に影響を与える共変量を制御したうえで群間比較を行う手法です。モデルは次のように表されます。

$$ Y_{ij} = \mu + \tau_i + \beta(X_{ij} – \bar{X}) + \epsilon_{ij} $$

  • $ Y_{ij} $ :i群のj番目の従属変数
  • $ \mu $ :全体平均
  • $ \tau_i $ :i群の効果
  • $ \beta $ :共変量Xの回帰係数
  • $ X_{ij} $ :共変量の観測値
  • $ \epsilon_{ij} $ :誤差項

ANCOVAは、共変量による影響を取り除いた調整後平均を算出し、群間差を検定します。

ANCOVAの前提条件

  • 独立性:各観測値は独立している。
  • 正規性:残差が正規分布に従う。
  • 等分散性:各群の誤差分散が等しい。
  • 共変量と従属変数の線形関係:共変量は従属変数に対して線形に影響する。
  • 共変量の独立性:共変量は実験操作の影響を受けていない。
  • 共変量と要因効果の交互作用がない:共変量と要因の間に交互作用が存在しない。

ANCOVAの効果量

部分η²やω²に加えて、共変量の寄与率を加味した調整効果量を提示することが推奨されます。また、調整済み平均の差の大きさを標準化するCohen’s dやHedges’ gを追加で報告することもあります。

実例

実例1

教育研究において、3種類の学習法の効果を比較する実験を行ったが、事前テストの得点が従属変数(最終テスト得点)に影響すると考えられた。ANCOVAを用いて事前テスト得点を共変量として調整したところ、学習法の効果が有意であり、調整前の結果よりも効果量が正確に推定できた。

実例2

医学研究において、3種類の薬剤の血圧低下効果を比較した。年齢が血圧に影響するため、年齢を共変量としてANCOVAを行った。その結果、薬剤の主効果が有意であり、年齢の影響を除外した上で薬剤効果を正しく評価できた。

実例3

スポーツ科学において、異なるトレーニング法の効果を比較した。筋肉量を従属変数とし、初期体重を共変量としてANCOVAを行ったところ、トレーニング法の効果が有意に示され、初期体重の影響を除外した純粋な効果が確認された。

ANOVAとANCOVAの違いと使い分け

ANOVAは単純に群間平均の差を検討するのに対して、ANCOVAは共変量の影響を制御する点が異なります。もし共変量が従属変数に強く影響している場合、ANOVAでは誤った結論に至る可能性があります。特にランダム割付が不完全な研究や観察研究においてANCOVAは有効です。

タイプI, II, III平方和の補足

分散分析(ANOVA)や共分散分析(ANCOVA)を行う際、要因の平方和(Sum of Squares, SS)の算出方法には複数の定義があります。これらは主に「要因の順序」や「モデルに含まれる他の要因との関係」をどう扱うかに違いがあります。代表的なものがタイプI、タイプII、タイプIIIであり、実務的には解析ソフト(SPSS, SAS, Rなど)で指定できることが多いです。

タイプI平方和(逐次平方和, Sequential SS)

タイプI平方和は、モデルに変数を投入する順序に依存して計算されます。最初に投入された要因はデータ全体に基づく平方和を算出し、その後に投入された要因は既に投入された要因を説明した残差に基づいて平方和を算出します。したがって順序が異なれば結果も異なります。

数式的には次のように表されます。例えば、要因Aと要因Bがある場合、

$ SS_{A,\text{Type I}} = SS(A) $

$ SS_{B,\text{Type I}} = SS(A,B) – SS(A) $

すなわち、Bの平方和は「Aを説明に用いた後にBを追加することによって改善された分」として定義されます。

前提条件

  • 要因投入の順序に意味がある場合に適する
  • 実験計画法(要因配置実験など)でよく用いられる

実例

農業実験で「肥料Aをまず投入し、その後に水準Bを加える」など順序が実験計画上で自然に定義されている場合にはタイプI平方和が適しています。しかし、順序が恣意的な場合や交絡のある場合には解釈が難しくなるため注意が必要です。

タイプII平方和(部分平方和, Hierarchical SS)

タイプII平方和は、交互作用が存在しないと仮定して各主効果の平方和を算出する方法です。各主効果は、他の主効果を考慮したうえで算出されるため、順序には依存しません。ただし、交互作用がモデルに含まれる場合は解釈が難しくなることがあります。

例えば、要因Aと要因Bの主効果を考える場合、

$ SS_{A,\text{Type II}} = SS(A,B) – SS(B) $

$ SS_{B,\text{Type II}} = SS(A,B) – SS(A) $

と定義され、互いの影響を調整した平方和となります。

前提条件

  • 交互作用が存在しない、あるいは交互作用の効果が小さい場合に適する
  • 主効果の解釈を明確に行いたい場合に有効

実例

心理学や教育学の分野で「性別」と「学習方法」など2つの要因を比較したいが、交互作用の有無は事前に仮定できる場合、タイプII平方和が用いられます。たとえば「男性と女性で学習方法の効果は大きく変わらないはず」と考えられる場面で有効です。

タイプIII平方和(最尤平方和, Marginal SS)

タイプIII平方和は、モデル内の他の要因や交互作用をすべて考慮したうえで各要因の効果を算出します。すなわち、ある要因の効果は「他のすべてを調整したうえでの追加的な寄与」として評価されます。順序に依存せず、交互作用が存在しても適用可能です。

例えば、要因Aと要因Bがある場合、

$ SS_{A,\text{Type III}} = SS(A,B,AB) – SS(B,AB) $

$ SS_{B,\text{Type III}} = SS(A,B,AB) – SS(A,AB) $

と定義されます。

前提条件

  • 交互作用を含む一般線形モデルに適用可能
  • 観察データ解析や不均衡デザイン(群のサンプルサイズが不均等)で広く用いられる

実例

医学研究において「治療方法(薬A, 薬B)」と「性別」が交互作用を持つ可能性を排除できない場合、タイプIII平方和を用いて「性別を調整した上で治療効果を見る」といった解析が一般的です。特にSPSSなど多くのソフトの既定値はタイプIII平方和であり、臨床研究の標準的手法となっています。

ANOVAとANCOVAにおけるタイプI, II, IIIの使い分け

ANOVAにおいては、

  • 実験計画法に基づいた厳密な順序付けがある場合 → タイプI
  • 交互作用を無視できる場合 → タイプII
  • 交互作用を含めて全体像を把握したい場合、不均衡データの場合 → タイプIII

ANCOVAにおいては、共変量を調整する必要があるため、通常はタイプIII平方和が推奨されます。なぜなら、共変量や交互作用をすべて考慮したうえで主要因の効果を確認することが目的となるからです。タイプIやIIを選ぶと、共変量や群間の不均衡の影響を誤って解釈してしまう危険性があります。

効果量との関連

平方和のタイプは分散比(F値)やp値に影響を与えるだけでなく、効果量(Effect Size)の解釈にも影響します。ANOVAでは効果量として$ \eta^2 $(イータ二乗)、部分$ \eta^2 $(partial $ \eta^2 $)、$ \omega^2 $(オメガ二乗)がよく用いられますが、特に部分$ \eta^2 $はタイプIII平方和と親和性が高く、共変量や交互作用を含んだモデルでの解釈に適しています。

まとめ

ANOVAは群間の平均差を検定する基本手法であり、ANCOVAはその拡張として共変量を統制できる方法です。いずれの手法も適用には前提条件を確認することが不可欠であり、効果量をあわせて提示することで結果の解釈がより実質的なものになります。研究の目的やデザインに応じて両者を使い分けることが重要です。

Popular Articles