Top 5 This Week

関連記事

11. 不均一分散性:検定と対処

- 本サイト運営者のサービスの紹介 -

不均一分散性とは

線形回帰モデル $y_i = \mathbf{x}_i’ \boldsymbol{\beta} + \varepsilon_i$ において、ガウス=マルコフ定理が成立するための条件の一つは、誤差項の分散が説明変数に依存せず一定であることです。この均一分散性の条件は次の式で表されます。

$$\text{Var}(\varepsilon_i | \mathbf{X}) = \sigma^2 \quad (i = 1, \ldots, n)$$

しかし実際のデータでは、誤差の分散が説明変数の値に応じて変化する場合があります。この状況を不均一分散性と呼び、誤差分散のモデルは次のように記述されます。

$$\text{Var}(\varepsilon_i | \mathbf{X}) = \sigma_i^2 = \sigma^2(\mathbf{x}_i)$$

不均一分散性が生じる代表的な要因として、スケーリング効果があります。所得と消費支出の関係では、高所得者ほど消費の変動幅が大きくなる傾向があり、誤差分散が水準に比例して変化します。このような構造はクロスセクションデータ全般に広く見られます。

均一分散性が成立しない場合、通常最小二乗法(以下OLS)の係数推定量は依然として不偏かつ一致性を持ちますが、最小分散線形不偏推定量としての性質(ガウス=マルコフ定理の含意)を失います。さらに重要な点として、OLSが算出する標準誤差が誤った値をとるため、t検定やF検定の推論が信頼できなくなります。

本節の前提として、条件付き平均の線形性 $E[\varepsilon_i | \mathbf{X}] = 0$ および各観測の独立性が成立していること、また誤差の有限モーメントが存在することが必要です。不均一分散性は系列相関やモデル誤定式化といった他の仮定違反と同時に生じうる点に注意が必要です。また、残差プロットによる視覚的確認は形式的検定の代替にはならず、弱い異分散性の検出には十分でない場合があります。

均一分散性と不均一分散性の散布図比較

(Fig1. 均一分散性と不均一分散性の散布図比較)

White検定の理論と仕組み

White検定は、不均一分散の関数型について特定の仮定を設けず、一般的な異分散を検出できる手法です。帰無仮説は「誤差分散が均一である」、すなわち $\text{Var}(\varepsilon_i | \mathbf{X}) = \sigma^2$ です。対立仮説は分散が説明変数の何らかの関数に依存するという一般形をとります。

手順は2段階で構成されます。第1段階では、OLSの残差 $e_i$ を用いて残差の二乗 $e_i^2$ を目的変数とし、説明変数の各項・二乗項・交差積を含む補助回帰を推定します。

$$e_i^2 = \alpha_0 + \sum_{j} \alpha_j X_{ij} + \sum_{j \leq k} \alpha_{jk} X_{ij} X_{ik} + v_i$$

第2段階では、補助回帰の決定係数 $R^2_{\text{aux}}$ を用いてLM統計量を構成します。

$$LM = n \cdot R^2_{\text{aux}} \xrightarrow{d} \chi^2(q)$$

ここで $n$ はサンプルサイズ、$q$ は補助回帰の回帰係数数(切片を除く)であり、帰無仮説のもとで $LM$ は漸近的に自由度 $q$ のカイ二乗分布に従います。この結果は大標本近似に依存しており、帰無仮説のもとで元のモデルが正しく定式化されていることを前提とします。

標本サイズが小さい場合にはカイ二乗近似の信頼性が低下し、棄却率が名目的な有意水準からずれることがあります。また、異分散の関数型によっては補助回帰の説明力が低く、検定力が十分でない場合があります。

残差対当てはめ値プロット:異分散性の検出

(Fig2. 残差対当てはめ値プロット:異分散性の検出)

Breusch-Pagan検定の原理

Breusch-Pagan検定は、誤差分散が特定の変数 $\mathbf{z}_i$ の指数型関数として表されるという、より制約された分散モデルを仮定します。

$$\text{Var}(\varepsilon_i) = \sigma^2 \exp(\mathbf{z}_i’ \boldsymbol{\gamma})$$

帰無仮説は $\boldsymbol{\gamma} = \mathbf{0}$、すなわち分散が $\mathbf{z}_i$ に依存しないことです。検定統計量はOLS残差の二乗 $e_i^2$ を $\mathbf{z}_i$ に回帰する補助回帰から構成され、LM統計量は次の形をとります。

$$LM_{BP} = n \cdot R^2_{\text{aux}} \xrightarrow{d} \chi^2(p)$$

ここで $p$ は $\boldsymbol{\gamma}$ の次元(検定する変数の数)であり、この補助回帰に含まれる変数を分析者が事前に選択します。White検定との比較では、Breusch-Pagan検定は異分散の方向が事前に特定可能な場合に検定力で優位となります。一方、White検定は関数型を問わない汎用性を持ちますが、交差積・二乗項の追加によって自由度が大きくなり、検定力が低下しやすい点で異なります。この検定力と特定性のトレードオフは、実践における検定選択の主要な判断基準となります。

古典的な定式化では誤差の正規性が必要です。また、分散モデルの変数 $\mathbf{z}_i$ の選択が誤っている場合、検定力が著しく低下します。非正規誤差に対して結果が不安定になる点も限界として挙げられます。

White検定とBreusch-Pagan検定のp値比較

(Fig3. White検定とBreusch-Pagan検定のp値比較)

特性 White検定 Breusch-Pagan検定
帰無仮説 分散の均一性(関数型不問) 分散の均一性(指数型構造下)
分散形式の仮定 なし(一般形) 指数型 $\sigma^2 \exp(\mathbf{z}’\boldsymbol{\gamma})$
計算量 大(交差積・二乗項を含む) 小(選択した変数のみ)
検定力 汎用的だが自由度増大で低下 モデルが正しければ高い
適用場面 異分散の形式が不明 異分散の方向が事前に特定可能

ロバスト標準誤差:推定値の修正

不均一分散が存在する場合でも、OLSの係数推定量 $\hat{\boldsymbol{\beta}}$ は一致性を保ちます。しかし、OLSが均一分散を前提として計算する通常の標準誤差は誤った値をとります。不均一分散整合標準誤差(ロバスト標準誤差)は、係数推定値を変えることなく、標準誤差の部分のみを修正することで推論の信頼性を回復します。

$\hat{\boldsymbol{\beta}}$ の漸近分散推定量は次の形をとります。

$$\widehat{\text{Var}}(\hat{\boldsymbol{\beta}}) = (\mathbf{X}’\mathbf{X})^{-1} \mathbf{X}’ \hat{\Omega} \mathbf{X} (\mathbf{X}’\mathbf{X})^{-1}$$

ここで $\hat{\Omega}$ は残差の二乗を対角要素とする行列です。HC0 推定量では $\hat{\Omega} = \text{diag}(e_i^2)$ とします。有限標本の偏りを補正するバリアントとして、HC1 は自由度補正 $n/(n-k)$ を乗じたものであり、HC2 は $e_i^2/(1-h_{ii})$ を用います($h_{ii}$ はハット行列 $\mathbf{H} = \mathbf{X}(\mathbf{X}’\mathbf{X})^{-1}\mathbf{X}’$ の対角要素)。HC3 はさらに保守的な修正として $e_i^2/(1-h_{ii})^2$ を採用します。

不均一分散のもとでの $\hat{\boldsymbol{\beta}}$ の漸近正規性は次のとおりです。

$$\sqrt{n}(\hat{\boldsymbol{\beta}} – \boldsymbol{\beta}) \xrightarrow{d} \mathcal{N}(\mathbf{0},\ \mathbf{Q}_{XX}^{-1} \mathbf{S} \mathbf{Q}_{XX}^{-1})$$

ここで $\mathbf{Q}_{XX} = \text{plim}\, n^{-1}\mathbf{X}’\mathbf{X}$ および $\mathbf{S} = \text{plim}\, n^{-1}\mathbf{X}’ \Omega \mathbf{X}$ です。この修正によってt検定のt値とp値が変化し、推論の結論が変わる場合があります。

この方法の適用には、OLS推定量の一致性(条件付き平均の正しい定式化)と大標本の妥当性が必要です。ロバスト標準誤差は一般化最小二乗法が提供する効率性の改善を回収しません。小標本では性能が不安定であり、信頼区間の偏りを完全に除去するわけでもない点が限界です。

標準誤差の修正:OLS vs HC vs GLS

(Fig4. 標準誤差の修正:OLS vs HC vs GLS)

加重最小二乗法と一般化最小二乗法

不均一分散の構造が既知または推定可能な場合、加重最小二乗法や一般化最小二乗法を用いることで、OLSと比較して効率的な推定量を得ることができます。加重最小二乗法は各観測に重み $w_i$ を付与し、分散の大きい観測の影響を軽減します。目的関数は次のとおりです。

$$\hat{\boldsymbol{\beta}}_{\text{WLS}} = \arg\min_{\boldsymbol{\beta}} \sum_{i=1}^n w_i (y_i – \mathbf{x}_i’ \boldsymbol{\beta})^2$$

分散が既知のとき、最適な重みは $w_i = 1/\sigma_i^2$ であり、この設定下では加重最小二乗法推定量がBLUEとなります。分散が未知の場合には、実現可能一般化最小二乗法(FGLS)を用います。FGLS の2段階手順は次のとおりです。第1段階でOLS残差 $e_i$ を用いて分散構造 $\sigma_i^2 = g(\mathbf{x}_i; \boldsymbol{\theta})$ をモデル化し、推定値 $\hat{\sigma}_i^2$ から重み $\hat{w}_i = 1/\hat{\sigma}_i^2$ を導出します。第2段階ではその重みを用いて加重最小二乗法を実施します。

一般化最小二乗法推定量の漸近正規性は次の形で表されます。

$$\sqrt{n}(\hat{\boldsymbol{\beta}}_{\text{GLS}} – \boldsymbol{\beta}) \xrightarrow{d} \mathcal{N}\!\left(\mathbf{0},\ \left(\mathbf{X}’ \Omega^{-1} \mathbf{X}\right)^{-1}\right)$$

この漸近分散はガウス=マルコフ定理の拡張として最小となり、一般化最小二乗法推定量が分散行列 $\Omega$ のもとで漸近的に最効率であることを示します。前提として、分散関数の正しい定式化と、重みが一致推定量から導出されることが必要です。分散構造の誤定式化は効率性の低下を招き、重みが大きく誤っている場合にはOLSより非効率になる場合があります。また、分散の推定が加わることで計算量が増加します。

金融データでの実践例

金融工学における資産リターンの回帰分析は、不均一分散性の影響が顕著に現れる場面です。市場要因 $f_t$ に対する個別銘柄の超過リターン $r_t$ の回帰モデルは次のとおりです。

$$r_t = \alpha + \beta f_t + \varepsilon_t, \quad t = 1, \ldots, T$$

高ボラティリティ局面では $\text{Var}(\varepsilon_t)$ が拡大し、市場が安定している局面では縮小するため、均一分散性の仮定が成立しないことが多くあります。残差から分散構造を推定するには、まず OLS 残差 $e_t$ を求め、リターンの絶対値や市場状況を示す変数を用いて次のような分散のモデルを構成します。

$$\log \hat{\sigma}_t^2 = \delta_0 + \delta_1 |f_t| + \delta_2 \mathbf{1}_{\{|r_t|>\tau\}} + u_t$$

OLS・ロバスト標準誤差・加重最小二乗法の標準誤差を比較すると、通常OLSの標準誤差はボラティリティの高い期間を反映できず過小推定となる傾向があります。ロバスト標準誤差はこの偏りを修正し、加重最小二乗法はボラティリティが高い観測の重みを下げることで効率的な推定を実現します。リスク推定や取引戦略の有意性検定において、標準誤差の選択が結論に影響する場面があります。

この実践例の前提として、リターン系列の定常性と省略変数バイアスがないことが必要です。しかし実際の金融データでは、誤差分散が時点に依存して動的に変化するGARCH型の条件付き異分散が発生することが多く、静的な不均一分散を想定した検定や修正は十分でない場合があります。この限界に対処するためには、GARCHなどの時系列ボラティリティモデルへの発展が必要となります。

異分散性への対処戦略の比較と選択

不均一分散性への対処戦略はロバスト性と効率性のトレードオフによって整理できます。ロバスト標準誤差は係数推定量を変更せず推論の信頼性を高める手段であり、分散構造の仮定が不確かな場合に適します。一般化最小二乗法は正しい分散構造が特定できる場合に効率性で優位となります。その関係は次のように表されます。

$$\text{Var}(\hat{\boldsymbol{\beta}}_{\text{GLS}}) \leq \text{Var}(\hat{\boldsymbol{\beta}}_{\text{OLS}})$$

分散安定化変換も有効な選択肢であり、目的変数を変換することで異分散を軽減できる場合があります。

$$y^* = \sqrt{y} \quad \text{または} \quad y^* = \log y$$

変換は解釈を変えるため、元のスケールへの対応を明確にする必要があります。また変換によって均一分散が達成できるとは限らない点も限界です。診断の手順としては、残差プロットによる確認、White検定またはBreusch-Pagan検定の実施、そして分散構造の仮定に基づく推定方法の選択という流れが一般的です。なお、これらの手法はいずれも静的な不均一分散を対象としており、時間的依存を伴う動的異分散への対処には時系列ボラティリティモデルが必要となります。

方法 係数推定 標準誤差 計算コスト 効率性
OLS(通常) 不偏・一致 不均一分散下で誤り 非効率(不均一分散下)
ロバスト標準誤差 OLSと同一 不均一分散整合的 低〜中 係数は非効率のまま
加重最小二乗法 分散既知時に最適 正しい重みで有効 分散構造が正しければ高い
一般化最小二乗法 漸近的に最効率 推定分散に基づく 正しい分散モデル下で最高

Popular Articles