連載

あなたはビルゲイツの試験に受かるか?
バックナンバー

その121

条件付き確率

前号へ
  次号へ

 ノーベル経済学賞を受賞したダニエル・カーネマンが心理学の実験で出題したのが前問で見た設問で、面接試験にはその中身を変えた形で登場することがあります。  その骨子は、ある事象A が起こる条件下で、別の事象Bが起こる確率を求めるもので、それは「条件付き確率」と言って、ベイズの定理としてもよく知られています。

 そのトーマス・ベイズは、日本で言えば徳川幕府の吉宗8代将軍のころにあたる1700年代の前半を生きたイギリスの牧師・数学者で、定理の「結果から原因の確率を推測する」、「過去から未来を推測する」という手法により、現代のグーグルの検索手法やマイクロソフトのNotification Platform、あるいはインテルのアプリケーション開発用のツールキットなどで利用されており、そんな昔に提唱された定理が、現代のIT先端企業で活用されている事実には驚きです。
 その他、臨床試験や法廷、沈没した潜水艦の発見に活用されたり、大学入試などにも出題されています。

それでは今号の設問に入ります。
 

設問121    難病と言われている或る伝染病は1万分の1の確率で発症することがわかっていますが、これまでなかなかよい検知薬ができませんでした。しかし最近になって99%もの確率でこの伝染病の感染を特定できる新薬が開発されました。その新薬を使った検査で、あなたはこの伝染病に感染していると診断されてしまいました。絶望の淵に追いやられたあなたが、この伝染病に感染している確率は、ずばり答えてどれだけでしょうか。

 前問を解かれた方ならば、ピンときたのではないでしょうか。そうです。これは条件付き確率の前問と同じような問題で、この種の問題は中身を変えていろんなところに現れることから、しっかりとそれが理解できているかどうかを、もう一度確認していただくためのものです。
 もしも前号をまだやっていないということであれば、まずは前問から紐解いてください。

 では、前号で学んだように図形化による解法でやってみます。
 まずは条件付きの確率として、1万分の1という伝染病の発症率です。その確率は0.01%。(図1)

 次に、新薬による伝染病の検出確率です。正しく検出できる確率は99%で、1%が誤りです。(図2)

 これにより(図3)のように、真に感染と判定される部分0.01% x 99% = 0.0099%と、誤って感染と判定される部分99.99% x 1% = 0.9999%が簡単にわかりますから、感染と判定される全体の確率は0.0099% + 0.9999% = 1.0098%。
 したがって、本当に感染している確率は、真の感染判定確率0.0099%をこの全体確率で割った結果の0.009804が答で、それは0.98%、つまり1%にもならないことから、絶望の淵に追いやられる必要はまったくないということです。

 なぜこんなに少ない確率になってしまうのか。
それは、たとえ新薬の誤認確率が、たったの1%といえども、伝染病が発症しないという割合が1万分の9999と、ほとんど全部を占めているため、実際に真に感染と判定される数よりも、誤認部分の数のほうが多くなってしまうからです。

 パーセンテージだけの計算では、なんだか抽象的な計算ばかりになってしまうようで、すっきりしないという方や、中高大学生の読者も多いということから、少々詳しくなるかもしれませんが、簡単だとされる方には少し我慢していただき、次に人数を入れた具体的な別の形でやってみます。

 では、この新薬で100万人を検査したとします。すると、そのうち10000分の1に相当する100人が伝染病に感染していることになります。
 ここで新薬は99%の確率で感染を特定しますので、この100人のうち真に感染と判断されるのは99人です。

 一方、100万人のうち、感染していない人は99万9900人になります。これは100万人から、感染者の100人を引いたものです。
 そしてこの非感染者に対して、新薬は1%の確率で感染者だと誤って判断します。その数は99万9900 x 1% = 9999人です。

 したがってこの新薬で100万人を検査した場合、感染と判断されるのは、全部で「99人+9999人」で、10098人になります。
 これを分母にして、真の感染者である99人を割り算すると、答は0.009804と、前の図形による結果と同じなります。

 感染者の薬品検査ということで、次のような出題例もありますので、この機会にご披露しておきます。

「ある国では、1000分の1の確率である病気に感染している。検査薬により、感染者は98%の確率で陽性反応が出る。しかし非感染者でも1%の確率で陽性反応が出てしまう。そこで、Aさんに陽性反応が出たが、Aさんが感染している確率は?」

 図形化をマスターされている方ならば、この出題で前問や今回の設問と違う点に気づかれると思います。
 それは検査薬の識別能力として、正しい検出が98%。だから誤検出が2%の確率になるという具合にはなっていないことです。

 つまり感染者と非感染者の違いにより、ここでは誤検出が2%ではなく、1%になっている点です。

 現実的には変則とも思われる検査薬の感を受けますが、面接の受験者が試験官にその旨の質問をすれば、この受験者はよく理解している、と事前に好印象を与えることになるかもしれません。
 何事も好印象を与えるということは大きくプラスにはなっても、決してマイナスにはならないので、常に心掛けておいたほうがいいでしょう。

 このような変則検査薬でも、基本的な解法には変わりなく、ここまで進んでこられた皆さんは、もはや恐れるものは何もなく、すいすいと解けることになります。
 あとは、本文の設問をこれまで解いてきた順序そのままを進めるだけです。

 まずは条件付きの確率として、1000分の1という感染者率です。つまり0.1%。だから残りの非感染者率は99.9%です。
 次に検査薬による陽性反応の検出確率は、感染者では98%、非感染者では1%ですから、感染者の中で正しく陽性反応が検出される確率は0.1% x 98% = 0.098% ・・・(1) です。

 それに対して非感染者の中で、誤って陽性反応が検出される確率は99.9% x 1% = 0.999% ・・・(2)です。
したがって、この検出薬で検出される全体の陽性反応率は (1) + (2) = 1.097% ・・・(3) となります。
 これにより、真の陽性とされる確率は (1) ÷ (3) = 0.098% / 1.097% = 0.089334、つまりAさんが感染しているという疑いは、8.9%という非常に小さな確率になってしまうのです。

 感染している場合には98%という大きな陽性反応が出るのに、その感染しているという割合、つまり事前確率が0.1%と非常に小さいことと、逆に非感染の場合の誤った陽性反応が1%と非常に小さくても、非感染の割合が99.9%と非常に大きいことから、事後確率に大きな影響を与えてしまうのです。
 やはり、よほどしっかりとした事前の綿密な調査をしないと、冤罪や誤った結論付けというとんでもない結果を招くことになってしまうということです。

 事前確率と事後確率を使って、行方不明になった潜水艦を発見した実例があります。


 「1968年5月、アメリカの原子力潜水艦スコーピオンが大西洋で行方不明となった。この時捜索と並行して用いられた手法は次のものであった。

 まず海図上を多数のグリッドに分割してそこに潜水艦が沈んでいる事前確率を経験に基づいて割り振っておき、確率の高い所を捜索し、捜索の結果そこに見付からなかったら全体の確率を改訂する。また確率の高いところを捜索し、これを繰り返して絞り込みを行う。この方法で潜水艦は発見された。

 ある領域に潜水艦が沈んでいる確率を p とし、実際にそこにあるという条件でそれが発見される確率をqとしよう。その領域を捜索した結果、発見されなければ、潜水艦がそこに沈んでいる事後確率は
 p'= p(1−q)/{(1−p)+p(1−q)}
となる。
 それ以外の領域については残りの確率 1−p を、事前確率に比例する形で割り振る。」


 これはWikipediaの「ベイズの推定」から引用したものですが、このほかに被告人の有罪無罪を推定する例なども掲載されています。
 ベイズの定理の式を丸暗記すれば、式に数値を代入するだけで、いろんな問題も機械的に解け、したがってその利便性から巻頭に記述したグーグルやマイクロソフト、インテルなどの先進企業で盛んに使われるようになってきているわけです。

 しかし本連載シリーズでは、やがて大学入試の求める能力が変わってくるように、あくまでも「考える力」である地頭力、その思考プロセスの育成を重視していますので、丸暗記でパラメーターを代入すれば解答が得られるという類の機械的な手法は、敢えて避けています。

 当設問の背景は、ベイズの理論などを持ち出さなくても確率の論理思考、考え方ができているか、だから設問の要点を素早く理解し計算にとりかかることができるか、その回答スピードも見ようというものです。

 それでは設問121の解答です。

正解

正解121

 0.98%。 条件付きの確率として、1万分の1という伝染病の発症率は0.01%。だから非発症率は残りの99.99%。新薬による正しく検出できる確率は99%で、1%が誤りなので、真に感染と判定される部分0.01% x 99% = 0.0099%と、また非発症率のところで誤って感染と判定される部分99.99% x 1% = 0.9999%とを足したもの、0.0099% + 0.9999% = 1.0098%が、この新薬で感染と判定される全体の確率となる。だから本当に感染している確率は、真の感染判定確率0.0099%をこの全体確率で割った結果の0.009804、つまり0.98%が答。

 
 では、次の問題をやってみてください。


問題 設問122  停止状態の車の中に、ヘリウムガスの入った風船が浮かんでいます。 窓はすべて閉まっています。車が発進しました。 この風船は、進行方向(前)に動くでしょうか、 進行方向とは逆(後ろ)に動くでしょうか、 それとも動かないでしょうか?

前号へ   次号へ


 ビル・ゲイツの出題問題に関しては、HOW WOULD YOU MOVE MOUNT FUJI ? (Microsoft’s cult of the puzzle. How the world’s smartest companies select the most creative thinkers. )By William Poundstore の原書や、筆者の海外における友人たちの情報を参考にしています。
 また連絡先不明などにより、直接ご連絡の取れなかった一部メディア媒体からの引用画像につきましては、当欄上をお借りしてお許しをいただきたく、よろしくお願い申し上げます。

執筆者紹介


執筆者 梶谷通稔
(かじたに みちとし)

テレビ出演と取材(NHKクローズアップ現代、フジテレビ、テレビ朝日、スカパー)

出版

連載

新聞、雑誌インタビュー 多数

※この連載記事の著作権は、執筆者および株式会社あーぷに帰属しています。無断転載コピーはおやめください

Page top