これだけは知ってほしいデータ分析の基本「相関係数」のビジュアル解説
これだけは知ってほしいデータ分析の基本「相関係数」のビジュアル解説 / Credit:川勝康弘
mathematics

統計研究の「関係がある」ってどういう根拠なの?「相関係数」をビジュアル解説

2023.12.16 Saturday

ナゾロジーの記事でもこれまで「勉強時間と成績」「健康と運動」「知能と収入」など多くの「関連性」を扱った科学ニュースをお届けしてきました。

新たに発表される関連性の中には、経験的に「そうじゃないかなぁ」と疑っていたことを実証してくれたり、思いもよらない意外な繋がりを教えてくれたりなど、非常に興味深いものが含まれています。

中には「なぜそんな関係を調べたのか?」と笑ってしまうものもあったでしょう。

こうした統計研究では、しばしば「関連性が強い」という表現を見かけますが、データ同士の関係性とはどのように理解すればいいのでしょうか?

おそらくデータ分析の研究に対して、「本当に関係があるの?」と疑う人もいるでしょう。

そこで今回は「相関関係」にフォーカスして、身近な物事から社会全体にかかわる現象まで、さまざまな関連性の強さをどのように理解したらいいのかを解説していきます。

複数の変数の関係性を見る https://www.stat.go.jp/naruhodo/10_tokucho/hukusu.html 熊本県:相関係数 https://www.pref.kumamoto.jp/uploaded/attachment/13589.pdf

相関係数をビジュアルで実感しよう!

(※グラフの視覚的理解を優先するために、各ポイントは正規分布からランダムに生成されたものを使用しています。つまり中央がもっともありふれた状態(密度が高い)となっています)
(※グラフの視覚的理解を優先するために、各ポイントは正規分布からランダムに生成されたものを使用しています。つまり中央がもっともありふれた状態(密度が高い)となっています) / Credit:川勝康弘

相関関係とは2つのデータの間にある関連性を指す言葉です。

そしてその相関関係の強さを表すのが、相関係数です。

そんなさまざまな現象の相関係数について語る前に、まずは相関係数というものを視覚的に確認してみましょう。

上の図は相関係数を、おおよそ0.1刻みで表示したものとなっており、相関係数が「-1(完全に逆相関)」から「1(完全に相関)」までが並べられています。

相関係数0の場合

相関係数0の場合
相関係数0の場合 / Credit:川勝康弘

グラフをみれば、相関係数0のグラフは中央に団子状に固まっており、横軸や縦軸の数値変化に対して、特定の「傾き」を見せることはありません。

たとえるならば、今日の朝ごはんのメニューの種類数とここ100年の間で観察された超新星爆発の頻度との関連性などが当てはまるでしょう。

自分の朝ごはんが超新星爆発に関連している人がいないかぎり、ポイントの集団に傾きがうまれることはありません。

相関係数1の場合

相関係数1の場合
相関係数1の場合 / Credit:川勝康弘

一方、相関係数が1のグラフは全てのポイントが直線状に整列しており、「横軸の値が○○ならば縦軸の値は絶対に✕✕になる」という完璧な比例が成立していることがわかります。

ただ現実問題として、2つの現象が完璧に相関することはなく、現実世界で相関係数が「1」に達する事例はほぼ存在しないと考えられます。

※相関係数が1の場合、例外が全く存在しないことを示しているからです

特にさまざまな要因が関係する社会学や心理学の分野において、相関係数が0.9以上になることは極めて稀となっています。

「絶対は存在しない」という言葉も、現実世界で相関係数1の現象がないことから言われているのでしょう。

ここまでは、誰もが納得する内容だと思います。

ビジュアル的にも団子と直線という明確な差が見て取れるからです。

では弱い相関に該当する、相関係数「0.1」や「0.2」はどうでしょうか?

次ページ相関係数0.1~0.9の視覚的理解

<

1

2

3

>

人気記事ランキング

  • TODAY
  • WEEK
  • MONTH

Amazonお買い得品ランキング

数学のニュースmathematics news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!