2026年 4月 12日 日曜日

Top 5 This Week

Related Posts

1.6 正の相関・負の相関・無相関の具体例

- 本サイト運営者のサービスの紹介 -


データ分析において、2つの変数がどのように連動して変化するかを把握することは、現象の構造を理解するための基礎となります。相関分析では、この連動性の方向と強さを「相関係数(Correlation Coefficient)」という指標を用いて定量化します。

ピアソンの積率相関係数 $r$ は、常に $-1 \leq r \leq 1$ の範囲の値をとります。この数値の符号(プラス、マイナス、あるいはゼロ付近)によって、変数間の関係性は「正の相関」「負の相関」「無相関」の3つに大別されます。本項では、それぞれの関係性の数理的な意味と、散布図上の特徴、および実社会における具体的な事例を体系的に解説します。

1. 正の相関(Positive Correlation)

正の相関とは、一方の変数($X$)が増加した際に、もう一方の変数($Y$)も連動して増加する傾向を持つ関係性を指します。相関係数 $r$ は $0 < r \leq 1$ の値をとり、$1$ に近づくほどその連動性が強い(データポイントが直線上に密接して並ぶ)ことを意味します。

数理的には、それぞれの変数の平均値 $\bar{x}, \bar{y}$ からの偏差の積 $(x_i – \bar{x})(y_i – \bar{y})$ を計算した際、両変数が共に平均より大きい(プラス×プラス=プラス)、または共に平均より小さい(マイナス×マイナス=プラス)データ点の割合が支配的である場合に、共分散が正の大きな値をとることで算出されます。

身近な具体例
「気温」と「清涼飲料水の売上」の関係が代表的です。気温が上昇するにつれて、消費者の購買意欲が高まり、清涼飲料水の売上も増加する傾向があります。他にも「身長」と「体重」の関係や、「勉強時間」と「テストの点数」の関係などが正の相関に該当します。

2. 負の相関(Negative Correlation)

負の相関とは、一方の変数($X$)が増加した際に、もう一方の変数($Y$)が減少する傾向を持つ関係性を指します。相関係数 $r$ は $-1 \leq r < 0$ の値をとり、$-1$ に近づくほど強い逆方向の連動性を持つことを意味します。

数理的には、一方の変数が平均より大きいときに他方が平均より小さい(プラス×マイナス=マイナス)、あるいはその逆(マイナス×プラス=マイナス)となるデータ点が多く存在し、偏差の積の合計(共分散)が負の値をとることで算出されます。

身近な具体例
経済学における需要の法則が示す「商品の価格」と「販売数量」の関係が典型的です。価格が上昇すると、消費者は購入を控えるため販売数量は減少します。また、「標高」と「気温」の関係(標高が高くなるほど気温が下がる)や、「機械の使用年数」と「バッテリーの持ち時間」の関係なども負の相関として観測されます。

3. 無相関(No Correlation)

無相関とは、2つの変数の間に直線的な連動傾向が全く見られない状態を指します。一方の変数($X$)が増加しても、もう一方の変数($Y$)が増加するのか減少するのか予測できない状態です。このとき、相関係数 $r$ は $0$ または $0$ に極めて近い値をとります。

数理的には、偏差の積 $(x_i – \bar{x})(y_i – \bar{y})$ がプラスになるデータ点とマイナスになるデータ点がランダムに混在しており、それらをすべて足し合わせた結果、互いに相殺されて共分散が $0$ に近づくことで表現されます。

身近な具体例
「社員の社員番号」と「営業成績」の関係や、「足のサイズ」と「タイピングの速度」の関係などが挙げられます。これらは互いに影響を及ぼし合う物理的・論理的なメカニズムが存在しないため、散布図を作成してもデータポイントが無秩序に散らばるだけとなります。

4. 3つの関係性の視覚的・定量的比較

データ分析の実務においては、相関係数の数値だけを確認するのではなく、必ず散布図を描画して関係性の方向と強さを視覚的に検証することが求められます。以下の表に、それぞれの関係性の特徴を整理します。

正の相関・負の相関・無相関の散布図

(図1. 正の相関・負の相関・無相関の散布図)

関係性の種類 相関係数 ($r$) の範囲 散布図の形状 データの傾向
正の相関 $0 < r \leq 1$ 左下から右上へ向かう右肩上がりの分布 $X$ が増加すると、$Y$ も増加する
負の相関 $-1 \leq r < 0$ 左上から右下へ向かう右肩下がりの分布 $X$ が増加すると、$Y$ は減少する
無相関 $r \approx 0$ 特定の方向性を持たず、円状または無作為に散らばる分布 $X$ の増減から $Y$ の増減を予測できない

5. 【実務事例】ビジネス・製造現場における相関の解釈

理論的な分類を踏まえ、実際のビジネスや工業分野において、正・負・無相関がどのように現れ、どのように意思決定に活用されるのかを具体的な事例で解説します。

5.1 マーケティング領域におけるプロモーション分析

背景
ある小売チェーンにおいて、週末に実施している「折り込みチラシの配布枚数」と、各店舗の「週末の来店客数」および「クレーム発生件数」のデータを収集し、プロモーションの効果とオペレーションへの影響を評価しました。

分析と解釈
「チラシ配布枚数($X$)」と「来店客数($Y_1$)」の間には強い正の相関($r = 0.85$)が確認されました。これはチラシ配布が効果的に集客に結びついていることを示します。
一方で、「チラシ配布枚数($X$)」と「クレーム発生件数($Y_2$)」の間にも中程度の正の相関($r = 0.52$)が確認されました。来店客数が増加することで、レジの待ち時間増加や品切れが発生し、結果としてクレームを誘発していると推測されます。マーケティング部門は集客効果(正の相関)を最大化しつつ、店舗運営部門と連携してクレーム増加(別の正の相関)を抑えるための人員配置の最適化を図りました。

チラシ配布枚数と来店客数・クレーム件数の関係

(図2. チラシ配布枚数と来店客数・クレーム件数の関係)

5.2 製造業における設備稼働と不良品率の分析

背景
ある金属加工工場において、切削機械の「稼働時間」や「メンテナンス頻度」が、最終製品の「寸法不良率」にどのような影響を与えているかを調査しました。

分析と解釈
「刃(チップ)の連続使用時間($X_1$)」と「寸法不良率($Y$)」をプロットしたところ、明確な正の相関($r = 0.78$)が見られました。使用時間が長くなるほど刃が摩耗し、精度が落ちるという物理的な劣化現象がデータとして現れています。
次に、「月間の予防保全(メンテナンス)の実施回数($X_2$)」と「寸法不良率($Y$)」の相関を分析した結果、強い負の相関($r = -0.65$)が観測されました。メンテナンスを頻繁に行う(変数の増加)ほど、不良率が低下する(変数の減少)という関係性です。
さらに、「作業員の通勤時間($X_3$)」と「寸法不良率($Y$)」を確認したところ、相関係数は $r = 0.03$ となり、完全な無相関でした。
工場長はこれらの結果に基づき、無関係な要素(無相関)には資源を割かず、負の相関を示した「メンテナンス頻度」を一定水準まで引き上げることで、製品品質の安定化を実現しました。

製造現場における不良品率と各要因の相関

(図3. 製造現場における不良品率と各要因の相関)

まとめ

相関分析における「正の相関」「負の相関」「無相関」の識別は、データセット内に潜む規則性を発見し、システムやビジネスの挙動を理解するための出発点です。2つの変数が同じ方向に動くのか、逆方向に動くのか、あるいは全く関係がないのかを散布図と相関係数によって客観的に評価することが重要です。

ただし、相関係数が $0$ に近い(無相関である)場合でも、「直線的な関係性がない」だけであり、「U字型」などの非線形な関係性が潜んでいる可能性は否定できません。そのため、数値を盲信するのではなく、常にデータの分布形状を視覚的に確認するプロセスを怠らないことが、データサイエンスにおける品質担保の鍵となります。

Popular Articles