📊 統計・データ

生存者バイアス - ランキングに映らない失敗者たち

3 分で読める

生存者バイアスとは何か

第二次世界大戦中、米軍は帰還した爆撃機の被弾箇所を調査し、 その部分の装甲を強化しようとした。統計学者 Abraham Wald はこれに異を唱えた。 帰還した機体に弾痕がない箇所こそ、被弾すると帰還できない致命的な部位であると。 これが生存者バイアス (survivorship bias) の古典的な例である。

生存者バイアスは、成功した事例のみが観察可能で、 失敗した事例が見えなくなることで生じる系統的な認知の歪みである。 ランキングデータにおいても、このバイアスは至るところに潜んでいる。

ランキングに潜む生存者バイアス

「世界の億万長者ランキング」を見て起業を志す人は多い。 しかしこのランキングには、同じ時期に起業して失敗した数百万人は含まれていない。 成功者だけを観察して「起業すれば富裕層になれる」と結論づけるのは、 帰還した爆撃機だけを見て装甲を設計するのと同じ誤りである。

所得ランキングにも同様の問題がある。高所得国のデータは比較的正確だが、 紛争地域や極度の貧困地域ではそもそもデータ収集が困難である。 「測定できた人」だけのランキングは、最も困窮した人々を体系的に除外している。

健康データにおける生存者バイアス

「100 歳以上の長寿者に共通する習慣」という記事は人気があるが、 これは典型的な生存者バイアスである。同じ習慣を持ちながら 70 歳で亡くなった人は調査対象にならない。 長寿者に共通する特徴が長寿の原因であるとは限らない。

BMI と死亡率の関係にも生存者バイアスが影響する。 高齢者の研究で「やや肥満のほうが長生き」という結果が出ることがあるが、 これは痩せている高齢者の中に疾病による体重減少が含まれているためであり、 肥満が健康的であることを意味しない (逆因果)。

バイアスを認識した上でランキングを使う

生存者バイアスを完全に排除することは不可能である。 しかし、その存在を認識しているだけで、データの解釈は大きく変わる。 ランキングを見る際に問うべきは「ここに含まれていない人は誰か」 「なぜ含まれていないのか」である。

MyRank のランキングも例外ではない。インターネットにアクセスでき、 このツールを使える時点で、世界人口の一定層に限定されている。 デジタルデバイドの向こう側にいる人々は、ランキングの母集団に含まれない。 この自覚を持つことが、データリテラシーの核心である。

バイアスに対抗する思考法

生存者バイアスに対抗するための実践的な思考法がある。 第一に、「反事実」を想像すること。成功事例を見たら、 同じ条件で失敗した事例がどれだけあるかを考える。 第二に、「ベースレート」を確認すること。 特定の属性を持つ人の成功率ではなく、全体の成功率を基準にする。

第三に、「選択プロセス」を意識すること。 なぜそのデータが自分の目に入ったのか、どのようなフィルタリングを経ているのかを考える。 SNS のタイムラインに流れてくる成功談は、アルゴリズムによって エンゲージメントが高い (= 極端な) 事例が選択的に表示された結果である。

関連記事

関連用語

この記事は役に立ちましたか?