2026年 4月 12日 日曜日

Top 5 This Week

Related Posts

9.8 共分散構造分析(SEM)

- 本サイト運営者のサービスの紹介 -


多変量解析の集大成とも位置づけられる共分散構造分析(SEM: Structural Equation Modeling)は、複数の変数間に存在する複雑な因果関係や相関関係を、連立方程式として定式化し、データに基づいてその構造の妥当性を検証する統計手法です。

これまでに解説した重回帰分析や主成分分析、因子分析といった手法は、単一の目的関数を最適化する手法、あるいは変数間の関係性の一部を切り出して分析する手法でした。一方、SEMは「測定モデル(検証的因子分析)」と「構造モデル(パス解析)」を統合した包括的な枠組みを持ち、直接観測できない潜在変数(構成概念)を含んだ多段階の因果関係を同時に推定することができます。

1. 関連手法との比較

SEMの特性を明確にするため、他の代表的な多変量解析手法との比較を以下の表にまとめます。SEMが潜在変数の構築と、それらの間の因果関係の推定を両立している点が最大の特徴です。

分析手法 主な目的 潜在変数の扱い 因果関係の推定能力
重回帰分析 観測された説明変数群による、単一の目的変数の予測 扱えない(観測変数のみを使用) 単一の従属変数に対する直接効果のみ
探索的因子分析 (EFA) 多数の観測変数の背後に潜む、共通因子の発見と抽出 扱う(データ主導で抽出) 因果関係は扱わない(変数間の相関構造の要約)
検証的因子分析 (CFA) 理論的背景に基づく、観測変数と潜在変数の対応関係の検証 扱う(理論ベースで事前設定) 潜在変数間の相関は扱うが、因果の方向性は仮定しない
共分散構造分析 (SEM) 観測変数と潜在変数を含む、複雑な因果モデル全体の妥当性検証 扱う(CFAを包含) 多段階の因果関係(直接効果・間接効果)を同時推定

2. SEMを構成する2つのモデル

SEMは数学的に、以下の2つの部分モデルから構成されます。

測定モデル(Measurement Model)

直接観測できない潜在変数(構成概念)と、それを測定するための観測変数との関係を定義します。これは検証的因子分析(CFA)に相当します。例えば、アンケートの設問回答(観測変数)から「顧客満足度」という目に見えない指標(潜在変数)を構成する部分です。

数式としては、観測変数ベクトル $\mathbf{x}$、潜在変数ベクトル $\boldsymbol{\xi}$、因子負荷量行列 $\boldsymbol{\Lambda}$、測定誤差ベクトル $\boldsymbol{\delta}$ を用いて次のように表されます。

$$
\mathbf{x} = \boldsymbol{\Lambda} \boldsymbol{\xi} + \boldsymbol{\delta}
$$

構造モデル(Structural Model)

潜在変数間、あるいは観測変数間の因果関係(パス)を定義します。重回帰分析の連立方程式を拡張したものであり、ある方程式の従属変数が、別の方程式では独立変数として機能するような多段構造を許容します。

内生潜在変数(他の変数から影響を受ける変数)を $\boldsymbol{\eta}$、外生潜在変数(他の変数から影響を受けない変数)を $\boldsymbol{\xi}$ とすると、構造方程式は以下のように表されます。

$$
\boldsymbol{\eta} = \mathbf{B} \boldsymbol{\eta} + \boldsymbol{\Gamma} \boldsymbol{\xi} + \boldsymbol{\zeta}
$$

ここで、$\mathbf{B}$ と $\boldsymbol{\Gamma}$ は因果関係の強さを示すパス係数行列、$\boldsymbol{\zeta}$ は構造方程式の誤差(予測しきれなかった部分)です。

3. パラメータの推定原理

SEMの目的は、研究者が仮定した因果モデルから導かれる「モデルが含意する分散共分散行列 $\boldsymbol{\Sigma}(\boldsymbol{\theta})$」と、実際のデータから得られた「標本分散共分散行列 $\mathbf{S}$」が、可能な限り一致するようにパラメータ $\boldsymbol{\theta}$(パス係数や誤差分散など)を推定することです。

推定には、主に最尤法(Maximum Likelihood: ML)が用いられます。観測データが多変量正規分布に従うと仮定した場合、両行列の差異(不一致度)を表す関数 $F$ を最小化する最適化問題を解きます。

$$
F = \log |\boldsymbol{\Sigma}(\boldsymbol{\theta})| + \text{tr}(\mathbf{S} \boldsymbol{\Sigma}(\boldsymbol{\theta})^{-1}) – \log |\mathbf{S}| – p
$$

($p$ は観測変数の数)

仮定したモデルがデータに完全に適合する場合、$\boldsymbol{\Sigma}(\boldsymbol{\theta}) = \mathbf{S}$ となり、$F=0$ となります。

4. 事例:顧客ロイヤルティ構造の解明

SEMの実用的な事例として、小売業における「顧客ロイヤルティの因果構造モデル」を考えます。

【設定】
アンケート調査により、9つの設問(観測変数:$x_1 \sim x_9$)のデータを取得しました。理論的背景に基づき、以下の3つの潜在変数を設定します。

  • 潜在変数 $\xi_1$(サービス品質): $x_1$(店員の対応)、$x_2$(店舗の清潔さ)、$x_3$(品揃え)から構成
  • 潜在変数 $\eta_1$(顧客満足度): $x_4$(総合的な満足感)、$x_5$(期待への合致)、$x_6$(価格との見合い)から構成
  • 潜在変数 $\eta_2$(ロイヤルティ): $x_7$(再来店の意向)、$x_8$(他者への推奨意向)、$x_9$(競合店への非乗り換え意向)から構成

【仮説モデル(パスの設定)】

  1. 「サービス品質($\xi_1$)」は「顧客満足度($\eta_1$)」に正の影響を与える(直接効果)。
  2. 「顧客満足度($\eta_1$)」は「ロイヤルティ($\eta_2$)」に正の影響を与える(直接効果)。
  3. 「サービス品質($\xi_1$)」は「顧客満足度($\eta_1$)」を媒介して「ロイヤルティ($\eta_2$)」に影響を与える(間接効果)。

SEMを用いることで、これらの観測変数の測定誤差を分離した純粋な構成概念間のパス係数を算出し、「サービス品質を向上させることが、最終的なロイヤルティ向上にどの程度寄与するか」を定量的に評価・検証することが可能になります。

5. 適合度指標(Fit Indices)によるモデル評価

推定されたモデルが、実際のデータ(標本分散共分散行列)にどの程度適合しているかを評価するためには、複数の適合度指標を総合的に判断する必要があります。

指標名 概要 判断基準の目安
カイ二乗値($\chi^2$)と $p$値 モデルとデータの不一致度を検定する統計量。サンプルサイズが大きいと微小な差異でも有意($p < 0.05$)となりやすいため、単独での評価は推奨されない。 $p > 0.05$(帰無仮説:モデルはデータに適合している、を棄却しないことが理想)
GFI
(Goodness of Fit Index)
重回帰分析における決定係数($R^2$)に相当する指標。データ全体の分散共分散のうち、モデルで説明できた割合を示す。 $0.90$ 以上が許容範囲。
$0.95$ 以上で適合度が高いと判断。
RMSEA
(Root Mean Square Error of Approximation)
母集団におけるモデルの近似誤差(ズレ)を表す指標。モデルの複雑さ(自由度)に対するペナルティが考慮されている。 $0.05$ 以下が良好。
$0.08$ 以下が許容範囲。
$0.10$ 以上は不適合。
CFI
(Comparative Fit Index)
変数間に全く相関がないと仮定した独立モデル(最も適合が悪いモデル)と比較して、提案モデルがどの程度改善されているかを示す相対的適合度指標。 $0.90$ 以上が許容範囲。
$0.95$ 以上で適合度が高いと判断。
AIC
(Akaike Information Criterion)
適合度の高さとモデルの簡潔さ(パラメータの少なさ)のバランスを評価する情報量基準。絶対的な基準値はなく、複数の対立モデルを比較する際に使用する。 比較するモデルの中で、値が最も小さいものを最良モデルとして採択する。

6. 識別問題とモデルの修正

SEMにおいて留意すべき制約に「識別問題(Identification Problem)」があります。未知のパラメータ数(推定すべきパス係数や誤差分散の数)が、既知の情報量(観測変数の分散・共分散の数)を上回る場合、方程式を解くことができず、モデルは「識別不能(Under-identified)」となります。

これを回避するためには、十分な数の観測変数を用意する(1つの潜在変数につき最低3つの観測変数が推奨される)、あるいは理論的根拠に基づき一部のパス係数を0に固定するなどの制約を設ける必要があります。

また、初期モデルの適合度が低い場合は、修正指標(Modification Indices)を参照し、理論的な妥当性を損なわない範囲で新たなパスや誤差変数間の相関を追加し、モデルを改良する作業(モデル探索)が行われます。

まとめ

共分散構造分析(SEM)は、研究者が持つ理論的仮説を数理モデルとして定式化し、データによって客観的に検証するための枠組みです。測定誤差の統制と、多段的な因果関係の同時推定が可能であることから、心理学、社会学、マーケティングリサーチなど、観測不可能な変数を扱う多様な分野において不可欠な分析手法となっています。適切な適合度指標による厳密な評価を行うことで、信頼性の高い因果推論が可能になります。

Popular Articles