5.7 カイ二乗検定

統計学におけるカイ二乗検定（Chi-square test）は、カテゴリカルデータ（質的データ、名義尺度や順序尺度を含むデータ）の解析に広く用いられる基本的な検定手法です。カイ二乗検定は、観測された度数（実際に観測されたデータの数）と、理論的に期待される度数（仮説が成立した場合に予想されるデータの数）との差が統計的に有意であるかを調べるために用いられます。

この方法は特に、次のような研究課題において重要です。

ある集団の特性が期待される比率に従っているかを検証する場合
複数のカテゴリ変数の間に関連性があるかを調べる場合
観測された分布が理論的な分布と一致しているかを調べる場合

カイ二乗検定はその適用範囲が非常に広いため、医学、生物学、心理学、社会学、教育学、さらにはマーケティングや政治学など多岐にわたる分野で活用されています。本稿では、カイ二乗検定の基礎的な考え方、数式モデル、前提条件、種類、手順、実例、効果量、応用上の注意点を詳しく解説します。

カイ二乗検定の基本的な考え方

カイ二乗検定は、観測度数と期待度数の差を平方して期待度数で割り、それを全体で合計することで統計量を計算します。観測度数と期待度数が一致する場合、この統計量は小さな値になります。逆に差が大きければ統計量も大きくなり、帰無仮説（差がないという仮定）が棄却される可能性が高まります。

カイ二乗分布（非負の値しか取らず、自由度に依存した右裾の長い分布）は、この統計量の理論的な分布を与えるものであり、検定の有意性判定に用いられます。

数式モデル

カイ二乗検定の基本的な統計量は以下で表されます。

$$ \chi^2 = \sum_{i=1}^k \frac{(O_i – E_i)^2}{E_i} $$

$ O_i $ ：観測度数（Observed frequency）
$ E_i $ ：期待度数（Expected frequency）
$ k $ ：カテゴリ数

この統計量 $ \chi^2 $ は、自由度 $ df = k – 1 $ のカイ二乗分布に従います。ただし、検定の種類によって自由度は異なります。

前提条件

カイ二乗検定を適用するには以下の前提条件を満たす必要があります。

データはカテゴリカルデータであること。
観測値は独立していること（同じ対象が複数回数えられていないこと）。
期待度数は十分に大きいこと。一般的には、すべてのセルにおける期待度数が5以上であることが推奨されます。小さい場合にはFisherの正確確率検定を使用する必要があります。

カイ二乗検定の種類

適合度検定

適合度検定（Goodness-of-fit test）は、観測された分布が理論的に予想される分布と一致しているかを検証する方法です。

数式は以下の通りです。

$$ \chi^2 = \sum_{i=1}^k \frac{(O_i – E_i)^2}{E_i} $$

自由度は $ df = k – 1 – m $ となります。ここで $ m $ は推定した母数の数です。

実例

コイントスを100回行ったところ、表が62回、裏が38回出たとします。理論的には表と裏は50回ずつの期待度数です。この場合、カイ二乗検定を用いて、コインが公正であるかを検証できます。

独立性の検定

独立性の検定（Test of independence）は、2つのカテゴリ変数が独立であるかどうかを検証する方法です。クロス集計表（分割表）を用いて実施します。

期待度数は以下で計算されます。

$$ E_{ij} = \frac{(行合計_i) \times (列合計_j)}{総合計} $$

そして、統計量は

$$ \chi^2 = \sum_{i=1}^r \sum_{j=1}^c \frac{(O_{ij} – E_{ij})^2}{E_{ij}} $$

となります。自由度は $ (r-1)(c-1) $ です。

実例

喫煙習慣（喫煙あり・喫煙なし）と疾患の有無（疾患あり・疾患なし）の関係を調べたい場合、2×2の分割表を作成してカイ二乗検定を行うことができます。

分割表に基づく検定

独立性の検定は2×2表に限らず、例えば3×4のような分割表でも可能です。カテゴリ変数の水準が多い場合でも、同様の考え方で適用できます。

実例

異なる職業群（会社員、公務員、自営業、学生）とスポーツ習慣（週1回未満、週1回以上）の関連を調べたい場合、4×2の分割表でカイ二乗検定を行うことが可能です。

手順

観測度数をまとめた分割表を作成する。
期待度数を計算する。
観測度数と期待度数の差の平方を期待度数で割り、全てのセルで合計する。
統計量 $ \chi^2 $ を自由度に基づくカイ二乗分布と比較し、有意性を判定する。

効果量

カイ二乗検定における効果量の指標はいくつか存在します。

φ係数（phi coefficient）：2×2分割表に用いられる。

$$ \phi = \sqrt{\frac{\chi^2}{n}} $$

クラメールのV（Cramér’s V）：より大きな分割表に用いられる。

$$ V = \sqrt{\frac{\chi^2}{n(k-1)}} $$

ここで、$ k $ は行数と列数のうち小さい方です。

実例

選挙調査：候補者Aと候補者Bの支持率を地域別に調べ、分割表にまとめることで、地域と支持の独立性を検定できます。
医学研究：薬剤の投与群とプラセボ群における副作用の発生有無をクロス集計し、独立性を検定することで薬剤の影響を調べられます。
教育研究：学習方法（講義型、演習型、オンライン型）と試験合格・不合格の関係を調べ、学習法と成績の関連性を検討できます。

注意点

期待度数が小さい場合の扱い：セルの期待度数が5未満の場合、検定の信頼性が低下します。その場合はFisherの正確確率検定を使用します。
データの独立性：同一人物を複数回数えるなど、データの独立性が満たされない場合には適用できません。
検定結果の解釈：有意差があっても、どのセルが差に寄与しているかは分かりません。残差分析や標準化残差を用いた追加解析が必要です。

まとめ

カイ二乗検定はカテゴリカルデータの解析における基本的かつ強力な手法です。適合度検定や独立性の検定を通じて、理論と観測の一致や変数間の関係性を評価できます。適用の前提条件を守ること、効果量を報告すること、結果を適切に解釈することが重要です。実務的な応用例も多く、研究者にとって欠かせない統計手法といえます。

Movies

TV Shows

Music

Celebrity

Scandals

Drama

Lifestyle

Health

Technology

Company