順序応答変数と比例オッズモデルの動機
応答変数が「非常に不満」「不満」「普通」「満足」「非常に満足」のように自然な順序を持つカテゴリで測定される場合、その変数を順序応答変数と呼びます。Likert尺度(例:5段階評価)はこの典型です。順序尺度は名義尺度(無順序カテゴリ)とは異なり、カテゴリ間に意味のある順序関係が存在します。しかし量的変数とも異なり、隣接カテゴリ間の間隔が等しいとは仮定できません。
単純化のために順序変数を二値化する方法は情報損失をもたらします。「満足以上」対「それ以下」というカットポイントは恣意的であり、選択によって推定量が変化します。複数のカットポイントで繰り返し検定すれば多重比較の問題が生じます。これらを回避するため、累積確率を直接モデル化する方法が用いられます。
応答変数 $Y$ が $J$ カテゴリ($Y \in \{1, 2, \ldots, J\}$)をとるとき、累積確率を次のように定義します。
$$P(Y \leq j) \quad (j = 1, 2, \ldots, J-1)$$
累積確率は単調非減少性 $P(Y \leq 1) \leq P(Y \leq 2) \leq \cdots \leq P(Y \leq J-1) < 1$ を満たします。この構造を活用するのが比例オッズモデルです。なおカテゴリ数が $J = 2$ の場合、比例オッズモデルは通常の二値ロジスティック回帰に帰着します。
比例オッズモデルの定式化と累積ロジット
説明変数ベクトルを $\mathbf{x}$、応答変数を $Y$、カテゴリ数を $J$ とします。比例オッズモデルは各カテゴリ境界における累積ロジットを次のように定式化します。
$$\text{logit}\bigl(P(Y \leq j \mid \mathbf{x})\bigr) = \log \frac{P(Y \leq j \mid \mathbf{x})}{P(Y > j \mid \mathbf{x})} = \alpha_j – \boldsymbol{\beta}’\mathbf{x}$$
ここで $\alpha_j$ はカットポイント(切片パラメータ)、$\boldsymbol{\beta}$ は回帰係数ベクトルです。カットポイントには識別性のために順序制約が課されます。
$$\alpha_1 < \alpha_2 < \cdots < \alpha_{J-1}$$
比例オッズモデルの特徴は $\boldsymbol{\beta}$ が全カテゴリ境界 $j$ で共通である点にあります。これが比例オッズ仮定(平行性仮定)の直接的表現であり、説明変数の効果が境界によらず一定であることを意味します。累積確率はロジスティック関数を通じて得られ、各カテゴリ確率は次の差分により導出されます。
$$P(Y = j \mid \mathbf{x}) = P(Y \leq j \mid \mathbf{x}) – P(Y \leq j-1 \mid \mathbf{x})$$
ただし $P(Y \leq 0 \mid \mathbf{x}) \equiv 0$ および $P(Y \leq J \mid \mathbf{x}) \equiv 1$ と定義します。累積ロジットモデルは隣接カテゴリロジット(隣接する2カテゴリ間のオッズを境界ごとに推定)や継続比モデル(ある反応以上の確率を逐次的にモデル化)とは本質的に異なり、累積確率 $P(Y \leq j)$ を直接扱う点に特徴があります。カットポイントはモデルの識別性を保証するために順序制約のもとで推定されます。比例オッズ仮定(平行性仮定)は各カテゴリ境界での回帰係数ベクトルが同一であることを要求し、この仮定の妥当性は分析前に検証する必要があります。
(Fig1. 比例オッズモデルの累積確率曲線:説明変数の増加に伴い各カテゴリ境界の曲線が平行にシフトすることが平行性仮定の視覚的表現です)
最尤推定と統計的推測
$n$ 個の独立な観測値 $(y_i, \mathbf{x}_i)$ に対して、各 $y_i$ は $J$ カテゴリの多項分布に従います。対数尤度関数の構造は次のとおりです。
$$\ell(\boldsymbol{\alpha}, \boldsymbol{\beta}) = \sum_{i=1}^{n} \sum_{j=1}^{J} \mathbf{1}[y_i = j] \log P(Y = j \mid \mathbf{x}_i)$$
最尤推定はこの対数尤度をパラメータ $(\boldsymbol{\alpha}, \boldsymbol{\beta})$ に関して最大化することで得られます。スコア方程式(対数尤度の各パラメータに関する偏微分をゼロとおいた方程式)は閉形式解を持たないため、IRLS(反復重み付き最小二乗法)による数値最適化が適用されます。IRLSはニュートン–ラフソン法の特殊化であり、Fisher情報行列に基づく重み行列を反復更新して収束を達成します。カットポイントと回帰係数は同時に推定されます。
推定量の標準誤差はFisher情報行列の逆行列の対角要素の平方根として得られます。個別係数の有意性はWald統計量により評価されます。
$$W = \frac{\hat{\beta}_k}{\mathrm{SE}(\hat{\beta}_k)} \xrightarrow{d} \mathcal{N}(0, 1)$$
モデル全体の適合はヌルモデルに対する尤度比統計量で評価されます。
$$LR = -2(\ell_0 – \ell_1) \xrightarrow{d} \chi^2(p)$$
ここで $p$ は推定された回帰係数の個数、$\ell_0$ はヌルモデルの対数尤度、$\ell_1$ は推定モデルの対数尤度です。信頼区間はWald型($\hat{\beta}_k \pm z_{\alpha/2} \cdot \mathrm{SE}$)またはプロファイル尤度法により構成されます。プロファイル尤度法は有限標本での被覆率がより良好な場合があります。
推定には次の仮定が必要です。まず観測の独立性が前提となります。観測間に相関が存在する縦断データや階層構造データでは、一般化推定方程式や混合効果モデルへの拡張が必要です。次に各カテゴリに十分な観測数が必要であり、経験則として各応答カテゴリに最低5観測が推奨されます。カテゴリ数が多い場合はカットポイント推定の不安定性が増加します。また標準的な漸近結果は小標本では近似精度が低下するため、有限標本補正の適用を検討すべきです。
比例オッズ仮定の検定と診断
比例オッズ仮定の形式的定義は「回帰係数ベクトル $\boldsymbol{\beta}$ がカテゴリ境界 $j$ に依存しない」こと、すなわち全境界で同一の $\boldsymbol{\beta}$ が成立することです。この仮定の妥当性は統計的検定と視覚的診断の両面から評価されます。
Brant検定は各カテゴリ境界 $j$ に対して個別に二値ロジスティック回帰を推定し、得られた係数推定量 $\hat{\boldsymbol{\beta}}_j$ の境界間での一致をWald型統計量で検定します。境界 $j$ と境界 $l$($j \neq l$)、変数 $k$ について
$$\hat{\beta}_{jk} – \hat{\beta}_{lk}$$
の有意性を検定します。全体検定(全変数を同時に検定)と変数別検定を組み合わせることで、どの説明変数が仮定を違反しているかを特定できます。スコア検定(比例オッズスコア検定)は最大化された尤度のスコア統計量を用いた代替的な検定法であり、その統計量は漸近的に $\chi^2$ 分布に従います。
視覚的診断としてログオッズプロットが有効です。各カテゴリ境界で個別に推定したロジット直線を重ねて描き、直線が平行であれば仮定の証拠となります。仮定が違反されている場合の線は非平行となります。
(Fig2. 平行性仮定の視覚的診断:各カテゴリ境界で個別に推定したロジット直線が平行である(左)か非平行である(右)かを比較します)
仮定が統計的に違反されている場合の選択肢は主に三つあります。第一は多項ロジスティック回帰への移行(順序情報を活用しないが仮定の制約なし)、第二は部分比例オッズモデル(違反する説明変数のみ境界別係数を許容する拡張)、第三は順序プロビットモデルへの変更です。仮定の実務的解釈は厳格である必要はなく、近似的な平行性があれば比例オッズモデルは実務上有用な近似となる場合があります。
Brant検定は大標本において些細な違反でも統計的有意性を示す傾向があり、過検出の問題があります。一方で、検定が有意でないことは仮定の妥当性を保証しません。標本が小さい場合は検出力が不十分であり、実質的な違反を見逃す可能性があります。検定結果と視覚的診断を組み合わせた判断が推奨されます。
係数の解釈:累積オッズ比と予測確率
比例オッズモデルにおける回帰係数 $\hat{\beta}_k$ は累積オッズ比として解釈されます。説明変数 $x_k$ が1単位増加したとき、より高いカテゴリに属する累積オッズは次の関係を満たします。
$$\frac{P(Y > j \mid \mathbf{x} + \mathbf{e}_k)}{P(Y \leq j \mid \mathbf{x} + \mathbf{e}_k)} = \exp(\beta_k) \times \frac{P(Y > j \mid \mathbf{x})}{P(Y \leq j \mid \mathbf{x})}$$
すなわち $\exp(\beta_k)$ は「$x_k$ が1単位増加したときのより高いカテゴリへの累積オッズの乗数」です。この関係はすべてのカテゴリ境界 $j$ で共通に成立します(比例オッズ仮定)。$\beta_k > 0$ であれば $x_k$ の増加が高いカテゴリへの傾向を強めます。連続変数の場合、$\exp(\beta_k)$ は $x_k$ が1単位変化したときの累積オッズ比です。二値変数(ダミー変数)の場合は参照カテゴリと比較した累積オッズ比となります。累積オッズ比は隣接カテゴリ間の周辺オッズ比とは異なり、全カテゴリにわたる累積的な量である点に注意が必要です。
各カテゴリの予測確率は次の手順で計算されます。まず累積確率を算出し、差分によりカテゴリ確率を得ます。
$$\hat{P}(Y = j \mid \mathbf{x}) = \frac{1}{1 + e^{-(\hat{\alpha}_j – \hat{\boldsymbol{\beta}}’\mathbf{x})}} – \frac{1}{1 + e^{-(\hat{\alpha}_{j-1} – \hat{\boldsymbol{\beta}}’\mathbf{x})}}$$
平均限界効果(AME)は各観測における偏微分 $\partial P(Y = j \mid \mathbf{x}) / \partial x_k$ をデータ全体で平均したものであり、説明変数の1単位変化が各カテゴリ確率に与える平均的な変化量を表します。限界効果はカテゴリ $j$ ごとに異なる値を持ち、符号はカテゴリによって反転する可能性があるため、全カテゴリの値の報告が推奨されます。予測確率をプロットすることで、説明変数の変化に伴うカテゴリ分布の変化を把握しやすくなります。
(Fig3. 説明変数の変化に対する各カテゴリの予測確率:比例オッズモデルによる予測確率の構成を積み上げ棒グラフで示します)
実用的応用:社会調査の順序応答データ分析
社会科学における典型的応用として、政策支持度(1〜5段階)を従属変数とした回帰分析を考えます。モデルは次のように設定されます。
$$\text{logit}\bigl(P(Y \leq j)\bigr) = \alpha_j – \beta_1 \cdot \text{年齢} – \beta_2 \cdot \text{教育水準} – \beta_3 \cdot \text{収入}$$
Likert尺度データは順序性が保証されている一方で、カテゴリ間の等間隔性は仮定されません。「普通」から「満足」への距離が「満足」から「非常に満足」への距離と等しいとは言えないため、線形回帰の直接適用は不適切です。
モデル適合の評価にはMcFadden擬似 $R^2$($1 – \ell_1/\ell_0$)とAIC(赤池情報量規準)が使用されます。McFadden擬似 $R^2$ の値域は $[0, 1)$ であり、0.2〜0.4が一般に良好な適合の目安とされますが、線形回帰の決定係数と直接比較することはできません。
結果報告の標準形式として、各説明変数の累積オッズ比と95%信頼区間を表として提示します。たとえば教育水準の $\exp(\hat{\beta}) = 1.45$(95%CI: 1.21〜1.73)は、教育水準が1単位高い場合に政策支持の高いカテゴリへの累積オッズが1.45倍になることを意味します。代表的な共変量パターンに対する予測確率表を作成し、各カテゴリの絶対的な確率として結果を提示することが推奨されます。
この分析では、Likertデータの順序性は保証されていますが等間隔性は仮定しません。横断データへの比例オッズモデルの適用は変数間の関連を示すにとどまり、因果推論に直結しません。また、異なる回答者集団間でLikert評定の意味が一致すること(測定不変性)が暗黙に前提されますが、この検証には測定モデルの追加分析が別途必要です。
比較モデルと拡張:多項ロジットと部分比例オッズモデル
$J = 4$ カテゴリ、$p = 3$ 説明変数の場合のパラメータ数を比較すると、比例オッズモデルはカットポイント $(J-1) = 3$ 個と回帰係数 $p = 3$ 個の計6個を推定します。多項ロジスティック回帰は参照カテゴリを除く $(J-1)$ セットの係数を推定するため、切片を含めると $(J-1)(p+1) = 12$ 個のパラメータが必要です。順序情報を無視することで推定効率が低下し、パラメータ数の増加に伴う標準誤差の拡大が生じます。
比例オッズ仮定が一部の説明変数でのみ違反される場合、部分比例オッズモデル(partial POM)が有用です。特定の説明変数 $x_k$(集合 $S$ に属するもの)に対して係数が境界 $j$ に依存することを許容します。
$$\text{logit}\bigl(P(Y \leq j \mid \mathbf{x})\bigr) = \alpha_j – \sum_{k \notin S} \beta_k x_k – \sum_{k \in S} \beta_{jk} x_k$$
部分比例オッズモデルはパラメータ数の増加により解釈が複雑化し、過学習のリスクが高まる点に留意が必要です。
累積プロビットモデルは比例オッズモデルと同様の累積確率の構造を持ちますが、ロジスティック分布の代わりに正規分布に基づくプロビットリンク関数を用います。両モデルの実質的な差異は確率分布の裾の厚さに起因し、外れ値の多いデータでは異なる結果をもたらす可能性がありますが、多くの実データではほぼ同等の適合を示します。モデル選択の実務的指針はAIC・BICによる情報量規準とネストモデルに対する尤度比検定の組み合わせです。比例オッズモデルは応答変数に自然な順序が存在する場合のみ適切であり、名義尺度の応答変数への適用は不可です。
| モデル名 | 累積確率の扱い | 比例オッズ仮定 | パラメータ数(J=4, p=3) | 主な適用場面 |
|---|---|---|---|---|
| 比例オッズモデル | 累積ロジットを直接モデル化 | 必要(全境界で共通 β) | 6(カットポイント3+係数3) | 順序応答の標準的分析 |
| 多項ロジスティック回帰 | 各カテゴリ対の対数オッズを個別推定 | 不要 | 12(切片3+係数9) | 名義応答または仮定違反時 |
| 隣接カテゴリロジット | 隣接2カテゴリ間のオッズを逐次推定 | 類似の等値制約が必要 | 6(標準形) | 段階的移行過程の分析 |
| 累積プロビット | 累積プロビットを直接モデル化 | 必要(プロビットリンク版) | 6 | 正規分布の裾を仮定する場合 |

