📊 統計・データ

基準率無視 - 「上位 5%」が思ったほど珍しくない理由

3 分で読める

基準率無視とは何か

基準率無視 (base rate neglect) は、事前確率 (基準率) を無視して 個別の情報だけで判断してしまう認知バイアスである。 Kahneman & Tversky (1973) の有名な実験では、 「おとなしく、整理整頓が好きで、細部に注意を払う」という人物描写を読んだ被験者の多くが、 その人物を「図書館員」と推測した。 しかし図書館員は人口の 0.1% に過ぎず、農家は 2% を占める。 基準率を考慮すれば、その人物が農家である確率のほうがはるかに高い。

基準率無視は、鮮明で具体的な情報 (人物描写) が 抽象的な統計情報 (人口比率) を圧倒してしまう現象である。 人間の直感は「代表性ヒューリスティック」(典型的なイメージとの類似度) に 依存しやすく、確率的な推論が苦手である。

ランキングにおける基準率無視

「上位 5% に入っている」という情報を聞いたとき、 多くの人は「すごい」と感じる。しかし、何の上位 5% かによって意味は全く異なる。 世界 80 億人の上位 5% は 4 億人であり、日本人の大半が該当する指標もある。 「上位 5%」という数字の鮮明さが、母集団の大きさ (基準率) を忘れさせる。

逆に、「下位 30%」と聞くと深刻に感じるが、 世界全体で見た下位 30% は途上国の人口が大半を占める。 先進国に住んでいる時点で、多くの指標で世界の上位に位置する。 ランキングの数字を見る際は、「何人中の何人か」「どの母集団と比較しているか」を 常に確認する必要がある。

医療検査と基準率 - 偽陽性の罠

基準率無視の最も実害が大きい例は医療検査の解釈である。 感度 99%、特異度 95% の検査で陽性が出た場合、 多くの人 (医師を含む) は「99% の確率で病気」と解釈する。 しかし有病率 (基準率) が 0.1% の疾患では、 ベイズの定理により陽性的中率はわずか 2% である。 陽性者の 98% は実際には健康なのだ。

この直感に反する結果は、基準率 (有病率 0.1%) を無視して 検査の感度 (99%) だけに注目するために生じる。 1,000 人を検査すると、1 人の真の患者が陽性になる一方、 999 人の健康な人のうち 50 人 (5%) が偽陽性になる。 陽性者 51 人中、真の患者は 1 人だけである。

ランキングの「珍しさ」を正しく評価する

「上位 1%」は 100 人に 1 人であり、日本だけで 125 万人が該当する。 「上位 0.1%」でも 12.5 万人、「上位 0.01%」でも 1.25 万人である。 「1 万人に 1 人の才能」は、日本に 1.25 万人いる。 数字の「珍しさ」は、母集団の大きさによって相対化される。

世界 80 億人を母集団とすると、上位 1% は 8,000 万人、 上位 0.1% は 800 万人、上位 0.01% でも 80 万人である。 「世界で 80 万人しかいない」と聞くと稀に感じるが、 東京都の人口の半分以上に相当する。 パーセンタイルの数字を絶対数に変換する習慣をつけると、 基準率無視を防ぎ、より冷静な自己評価が可能になる。

ベイズ的思考の実践

基準率無視を克服するための最も強力なフレームワークはベイズ的思考である。 新しい情報 (ランキング結果、検査結果) を受け取ったとき、 事前確率 (基準率) を出発点とし、新情報によってどの程度更新されるかを考える。

実践的には「自然頻度」で考えることが有効だ。 「上位 5%」ではなく「100 人中 5 人」、 「感度 99%」ではなく「100 人の患者のうち 99 人が陽性」と言い換える。 確率を頻度に変換するだけで、基準率の無視は大幅に軽減される。 Gigerenzer (2002) は、自然頻度表現を使うと医師の正答率が 10% から 76% に跳ね上がることを実験的に示した。

関連記事

関連用語

この記事は役に立ちましたか?