古典的線形回帰モデルと5つの仮定
古典的線形回帰モデルは、$n$個の観測値に対して次の行列形式で記述されます。
$$Y = X\beta + \varepsilon$$
$Y$は$n\times 1$の応答変数ベクトル、$X$は$n\times p$の計画行列(各行が一つの観測に対応し、定数項のために第1列をすべて1とします)、$\beta$は$p\times 1$の未知パラメータベクトルです。誤差ベクトル$\varepsilon$は観測できない変動源、測定誤差、およびモデルに含まれない要因を集約した確率的要素であり、統計的推論において中心的な役割を担います。
OLS(最小二乗法)推定量は閉形式解として次のように表されます。
$$\hat{\beta} = (X’X)^{-1}X’Y$$
この解が一意に定まるためには、計画行列$X$がフルランクであること——すなわち$(X’X)$が正則(可逆)であること——が前提です。
モデルの仮定は大別すると、モデルの構造に関する仮定(仮定1)と誤差項の確率的性質に関する仮定(仮定2〜5)に分類されます。この区別は、仮定違反が点推定に影響するか推論に影響するかを理解するうえで有用です。5つの仮定の体系的な列挙を以下に示します。
- 仮定1 線形性
- 仮定2 外生性
- 仮定3 均一分散性
- 仮定4 系列無相関
- 仮定5 正規性
これら5つの仮定はいずれも理想化された条件です。現実のデータへの適用にあたっては、それぞれの成否を逐一確認することが不可欠です。
線形性と外生性:仮定1・2の役割
仮定1は、応答変数の条件付き期待値がパラメータ$\beta$に関して線形である、すなわち
$$E[Y|X] = X\beta$$
であることを要請します。ここでの「線形性」はパラメータに関する線形性を指します。説明変数$X$が$\log X$や$X^2$といった非線形変換を含んでいても、パラメータとの関係が線形であればこの仮定は成立します。問題となるのは、応答変数の真の関係が非線形であるにもかかわらず線形モデルを当てはめる場合です。この関数形の誤特定は系統的な偏りをOLS推定量に生じさせ、フィットされた値が一貫して過大または過小になるパターンを示します。残差プロットにおいて残差と予測値の間に曲線的なパターンが観察された場合、仮定1の違反が疑われます。
仮定2は、誤差項の条件付き期待値がゼロである、すなわち
$$E[\varepsilon|X] = 0$$
であることを要請します。この外生性条件が成立するとき$E[\hat{\beta}] = \beta$が導かれ、OLS推定量は不偏となります。外生性が崩れた状態を内生性と呼びます。内生性は、省略された交絡変数が説明変数と応答変数の両方と相関する場合(省略変数バイアス)、あるいは説明変数と応答変数の間に双方向の因果関係が存在する場合(同時方程式バイアス)などに生じます。
内生性が存在するOLS推定量は一致性を失い、観測数を増やしても真値に収束しません。また、内生性が疑われる観察研究において推定された係数を因果効果として解釈することは相関と因果を混同することになり、正当化されません。因果推論の文脈では、外生性の担保が推定量の解釈可能性の前提条件となります。
均一分散性と系列無相関:仮定3・4の意義
仮定3と仮定4をまとめて球形誤差条件と呼びます。この条件は、誤差ベクトルの分散共分散行列の構造として次のように表されます。
$$\text{Var}(\varepsilon|X) = \sigma^2 I$$
$\sigma^2$はスカラー、$I$は$n\times n$の単位行列です。この式はスカラー倍の単位行列構造を持ち、全観測にわたって誤差の分散が一定であること(均一分散性)と、異なる観測間の誤差が無相関であること(系列無相関)を同時に表しています。
仮定3(均一分散性)は、各観測$i$について$\text{Var}(\varepsilon_i|X) = \sigma^2$が成立することを要求します。この仮定が崩れた不均一分散の状態は
$$\text{Var}(\varepsilon_i) = \sigma_i^2$$
と表記され、分散が観測ごとに異なります。典型的なパターンとして、フィットされた値が増加するにつれて残差の散らばりが拡大する漏斗型が知られています。所得データや企業規模のデータではこの種の不均一分散が頻繁に観察されます。
仮定4(系列無相関)は、$i \neq j$のすべての観測対について
$$\text{Cov}(\varepsilon_i, \varepsilon_j|X) = 0 \quad (i \neq j)$$
であることを要請します。この仮定が崩れる典型例は時系列データです。隣接する時点の観測が同一の外的要因の影響を受け、誤差が同方向に連続する自己相関が発生します。パネルデータでも、同一個体の繰り返し観測間に相関が生じることがあります。
仮定3・4が崩れてもOLS推定量の不偏性は保たれます。しかし最小分散という性質(効率性)が失われ、OLSはBLUEでなくなります。さらに、OLSが算出する標準誤差が過小または過大に評価されるため、t検定やF検定の信頼性が損なわれます。標準誤差の過小評価は第一種の過誤率を名目水準より高くし、過大評価は検出力を不必要に低下させます。
(Fig1. 均一分散性が成立する場合(左)と不均一分散が生じる場合(右)の残差散布図)
正規性仮定と統計的推論
仮定5は、誤差ベクトルが多変量正規分布に従うことを要請します。
$$\varepsilon|X \sim N(0, \sigma^2 I)$$
この仮定のもとで、OLS推定量は有限標本において次の正規分布に従います。
$$\hat{\beta} \sim N\!\left(\beta,\ \sigma^2(X’X)^{-1}\right)$$
この有限標本正規性から、各係数に対するt統計量が厳密なt分布に従い、モデル全体の検定に用いるF統計量がF分布に従うことが導かれます。これにより、有限標本における検定と信頼区間が正確な確率的根拠を持ちます。正規性仮定は、推定量の分布だけでなく検定統計量の分布も完全に規定するという点で、推論の基礎として機能します。
正規性仮定が成立しない場合でも、$n$が十分大きければ中心極限定理によってOLS推定量の漸近分布が正規分布に収束します。この漸近的正規性は、正規性仮定なしで成立するため、大標本では仮定5を緩和することが可能です。ただし「十分大きい」の基準はデータの歪度や尖度に依存するため、一律には定まりません。
有限標本——特に観測数が数十程度の場合——では、外れ値が多い状況や誤差分布が厚い裾を持つ場合(自由度の小さいt分布など)に、正規性仮定が実質的に破られます。この状況では、t検定・F検定の信頼性が名目水準から外れ、信頼区間の被覆確率が不正確になります。大標本における漸近推論と有限標本における厳密推論の使い分けは、データの規模と分布の形状を踏まえて判断する必要があります。
(Fig2. 正規分布に従う誤差(左)と厚い裾を持つ分布(右)のヒストグラム比較)
ガウス=マルコフ定理:OLSがBLUEである根拠
ガウス=マルコフ定理は、仮定1〜4が成立するとき、OLS推定量が線形不偏推定量のクラスの中で最小分散を達成することを主張します。この性質をBLUEと略します。BLUEはBest・Linear・Unbiased・Estimatorの頭文字であり、4つの要素はそれぞれ以下を意味します。
- 最良性(Best) 同クラス内で最小の分散行列を持つ
- 線形性(Linear) 観測ベクトル$Y$の線形関数として表される
- 不偏性(Unbiased) 期待値が真のパラメータ$\beta$と一致する
- 推定量(Estimator) データから計算可能な統計量である
任意の線形推定量を$\tilde{\beta} = CY$と表したとき、不偏性条件$E[\tilde{\beta}] = \beta$は行列条件$CX = I$と等価です。定理の証明は、$D = C – (X’X)^{-1}X’$と定義することで、任意の線形不偏推定量$\tilde{\beta}$の分散行列とOLS推定量の分散行列の差が
$$\text{Var}(\tilde{\beta}) – \text{Var}(\hat{\beta}) = \sigma^2 DD’$$
の形で表されることを示すことで構成されます。$DD’$は任意の行列$D$に対して半正定値行列となるため、OLS推定量の分散がいかなる線形不偏推定量の分散以下であることが従います。
この定理の成立に必要な仮定は1〜4のみです。正規性(仮定5)は不要です。また、計画行列$X$のフルランク条件——すなわち$(X’X)$が可逆であること——も必須です。
定理の適用範囲には重要な限定があります。BLUEは「線形推定量のクラス内で最良」を意味するに過ぎません。線形推定量のクラスの外に、誤差分布の形状情報を活用することでOLS推定量より小さい分散を達成する非線形推定量が存在しうる場合があります。また、仮定3または仮定4が崩れた場合、GLS(一般化最小二乗法)推定量がBLUEとなり、OLS推定量は最適性を失います。
仮定違反の影響と診断の方向性
仮定違反の影響は、点推定への影響(偏り)と推論への影響(標準誤差・検定統計量)の2類型に分類されます。この区別は、対処法の選択に直結します。
線形性または外生性の違反はOLS推定量の不偏性を損なわせます。これは点推定の問題であり、観測数を増やしても偏りは消えません。一方、均一分散性や系列無相関の違反は不偏性には影響しませんが効率性を損なわせ、標準誤差の推定に誤りをもたらします。ロバスト標準誤差(HC推定量、不均一分散一致推定量)は、OLS推定値の不偏性を保ちながら標準誤差の推定を修正する方法として広く用いられます。正規性の違反は有限標本においてt統計量・F統計量の厳密分布が崩れ、検定の大きさや信頼区間の被覆確率に影響を与えます。
仮定違反の検出には残差プロットやQQプロット(分位点プロット)が用いられます。フィットされた値に対する残差の散布図により、線形性・均一分散性の違反を視覚的に検出できます。残差にパターンがある場合は線形性の違反を、残差の散らばりが系統的に変化する場合は均一分散性の違反をそれぞれ示唆します。誤差の正規性はQQプロットで正規分位点との比較によって評価できます。目視診断は主観的な判断を伴うため、均一分散性の検定や系列相関の検定といった統計的検定との組み合わせが推奨されます。診断手法の詳細は残差分析(01_07)で扱い、本記事は概念の橋渡しにとどめます。
生物統計学の文脈では、臨床試験において降圧薬の投与量と収縮期血圧低下量の関係を線形モデルで分析する場面が典型的な応用例です。患者間には年齢・基礎疾患・測定タイミングの異質性が存在するため、均一分散仮定が崩れやすい状況にあります。投与量が大きい患者群では個体差による応答の散らばりが広くなる傾向があり、不均一分散が漏斗型のパターンとして現れることがあります。また、観察研究では交絡因子(生活習慣、併用薬など)が投与量と血圧低下量の両方と相関するため、外生性仮定を脅かします。外生性が成立していない状況でOLSによって推定された係数は因果効果の推定量として解釈できず、その解釈は関連性の記述にとどまります。
仮定3・4の違反に対しては、GLS(一般化最小二乗法)やWLS(加重最小二乗法)が代替手法として適用されます。GLSは誤差の分散共分散構造を既知または推定可能な形で取り込んでBLUEを回復します。WLSはGLSの特殊ケースとして、不均一分散の形状が既知の場合に観測ごとの重みを設定して効率的な推定を行います。不均一分散の存在のみが問題である場合には、OLS推定値を保ちながらロバスト標準誤差を用いることが実務上広く採用されています。
| 仮定番号 | 仮定名称 | 数学的条件(概要) | 保証する性質 | 違反時の主な影響 | 代替アプローチ |
|---|---|---|---|---|---|
| 1 | 線形性 | $E[Y|X] = X\beta$ | OLS不偏性(仮定2と共同) | 系統的バイアス、点推定の偏り | 非線形回帰・変数変換 |
| 2 | 外生性 | $E[\varepsilon|X] = 0$ | OLS不偏性・一致性 | 内生性バイアス(観測数を増やしても消えない) | 操作変数法 |
| 3 | 均一分散性 | $\text{Var}(\varepsilon_i|X) = \sigma^2$(全$i$) | OLS効率性(Best) | 非効率化・標準誤差の誤算定 | WLS・ロバスト標準誤差 |
| 4 | 系列無相関 | $\text{Cov}(\varepsilon_i,\varepsilon_j|X) = 0$($i\neq j$) | OLS効率性(Best) | 非効率化・標準誤差の過小評価 | GLS・HAC標準誤差 |
| 5 | 正規性 | $\varepsilon|X \sim N(0, \sigma^2 I)$ | 有限標本推論の厳密性 | 有限標本でのt/F検定の不正確さ | ブートストラップ・大標本近似 |

