定義
相関係数とは、2 つの変数の間にある線形関係の強さと方向を -1 から 1 の範囲で数値化した指標である。ピアソンの積率相関係数が最も広く使われ、 1 に近いほど強い正の相関、-1 に近いほど強い負の相関、0 に近いほど線形関係がないことを示す。
解釈の注意点
相関関係は因果関係を意味しない。GDP と平均寿命に正の相関があっても、 「GDP が上がれば寿命が延びる」とは断言できない。第三の変数 (医療インフラ、教育水準など) が両方に影響している可能性がある。
また、相関係数は線形関係のみを捉えるため、U 字型や指数的な関係は 検出できない。散布図による視覚的確認が常に推奨される。
ランキングデータでの応用
国別ランキングデータでは、所得と健康指標、教育水準と生活満足度など、 複数の指標間の関連を相関係数で定量化できる。スピアマンの順位相関係数は 順位データに適しており、外れ値の影響を受けにくい利点がある。
MyRank での活用
MyRank が提供する複数の指標 (年収、BMI、睡眠時間など) の間に どの程度の関連があるかを理解することで、自分の総合的な位置づけを 多角的に把握できる。1 つの指標だけで一喜一憂せず、指標間の関係性を 意識することがデータリテラシーの第一歩となる。