📊 統計・データ

信頼区間

しんらいくかん

母集団のパラメータが含まれると推定される値の範囲。95% 信頼区間が最も一般的に使用される。

1 分で読める

定義と正しい解釈

信頼区間とは、標本データから母集団のパラメータ (平均値など) が 含まれると推定される値の範囲である。95% 信頼区間は「同じ方法で 100 回標本を取ったとき、約 95 回はこの区間内に真の値が含まれる」 という頻度論的な意味を持つ。

よくある誤解

「真の値が 95% の確率でこの区間に入っている」という解釈は厳密には 誤りである。真の値は固定された定数であり、確率的に動くのは区間の方だ。 ただし実用上は「この範囲に真の値がある可能性が高い」と理解して 差し支えない場面が多い。

サンプルサイズとの関係

サンプルサイズが大きくなるほど信頼区間は狭くなり、推定の精度が 向上する。サンプルサイズを 4 倍にすると信頼区間の幅は約半分になる。 逆に、サンプルサイズが小さいデータから得られた推定値は、 広い信頼区間を伴い不確実性が大きい。

ランキングの不確実性

世界ランキングの元データは各国の調査に基づいており、調査ごとに サンプルサイズや調査方法が異なる。MyRank で表示される順位にも 一定の不確実性が伴う。信頼区間の概念を知っていれば、順位の 微小な差に過度な意味を見出さず、幅を持って結果を受け止められる。

関連用語

関連記事

この用語解説は役に立ちましたか?