モンティ・ホール問題

提供: miniwiki
2018/8/19/ (日) 17:18時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
移動先:案内検索
ファイル:Monty open door.svg
モンティ・ホール問題
閉まった3つのドアのうち、当たりは1つ。例示のように1つのドアが外れとわかった場合、直感的には残り2枚の当たりの確率はそれぞれ1/2になるように思える。

モンティ・ホール問題(モンティ・ホールもんだい、: Monty Hall problem)とは、確率論の問題で、ベイズの定理における事後確率、あるいは主観確率の例題のひとつとなっている。モンティ・ホールEnglish版 (Monty Hall, 本名 Monte Halperin) が司会者を務めるアメリカのゲームショー番組、「Let's make a dealEnglish版[1]」の中で行われたゲームに関する論争に由来する。一種の心理トリックになっており、確率論から導かれる結果を説明されても、なお納得しない者が少なくないことから、ジレンマあるいはパラドックスとも称される。「直感で正しいと思える解答と、論理的に正しい解答が異なる問題」の適例とされる。

なお、モンティ・ホール問題と実質的に同型である「3囚人問題」については、かつて日本で精力的に研究された。

概要

「プレーヤーの前に閉まった3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。

ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。プレーヤーはドアを変更すべきだろうか?」

1990年9月9日発行、ニュース雑誌 Parade にて、マリリン・ボス・サヴァントが連載するコラム「マリリンにおまかせ」において上記の読者投稿による質問に「正解は『ドアを変更する』である。なぜなら、ドアを変更した場合には景品を当てる確率が2倍になるからだ」と回答した。すると直後から、読者からの「彼女の解答は間違っている」との約1万通の投書が殺到し、本問題は大議論に発展した。

答えをめぐっての騒動

投書には、1000人近い博士号保持者からのものも含まれていた。その大部分は「ドアを変えても確率は五分五分(2分の1)であり、3分の2にはならない」とするものであった。サヴァントは投書への反論を試み、同年12月2日、数通の反論の手紙を紹介した。

  • ジョージ・メイソン大学 ロバート・サッチス博士「プロの数学者として、一般大衆の数学的知識の低さを憂慮する。自らの間違いを認める事で現状が改善されます」
  • フロリダ大学 スコット・スミス博士「君は明らかなヘマをした(中略)世界最高の知能指数保有者自らが数学的無知をこれ以上世間に広める愚行を直ちに止め、恥を知るように!」

サヴァントは、より簡易にした表を掲載「ドアを変えれば勝てるのは3回の内2回、負けるのは3回の内1回だけ、しかしドアを変えなければ勝てるのは3回の内1回だけ」と述べる。この問題に関する1991年2月17日付、3回目の記事の段階でサヴァントに対する反論は9割程度を占める。

  • E・レイ・ボボ博士「(前略)現在、憤懣やるかたない数学者を何人集めれば、貴女の考えを改める事が可能でしょうか?」

「現実が直観と反する時、人々は動揺する」とサヴァントはコラムで反論の声に応じ、下記の説明を試みる。 テンプレート:Cquote2 サヴァントの再再々解説でも大論争へと発展、「彼女こそ間違っている」という感情的なジェンダー問題にまで飛び火した。

プロ数学者ポール・エルデシュの弟子だったアンドリュー・ヴァージョニがモンティーホールジレンマをモンテカルロ法を使って自前のパーソナルコンピュータで数百回のシミュレーションを行うと、結果はサヴァントの答えと一致。エルデシュは「あり得ない」と主張していたがヴァージョニがコンピュータで弾き出した答えを見せられサヴァントが正しかったと認める[2]。しかし、これはゲームの暗黙のルール(後述のゲームのルールを参照)について誤解があったと思われている。後、カール・セーガンら著名人らがモンティーホール問題を解説、サヴァントの答えに反論を行なっていた人々は、誤りを認める。

サヴァントは、「最も高い知能指数を有する者が、子供でもわかる些細な間違いを新聞で晒した」等の数多くの非難に対して3回のコラムをこの問題にあて、激しい反論の攻撃に耐えて持論を擁護し通し、証明した[3]。それによると、ドアの数を100万に増やした例まで挙げて説明しても正しく理解してもらえなかったとのことである。

なお、サヴァントの本の183頁以降に、ミズーリ大学のドナルド・グランバーグ教授が補遺を記載している。それによると、モンティ・ホールジレンマに関しては、コラムでの議論ののちに、「アメリカン・スタティスティシャン」「アメリカン・マスマティカル・マンスリー」「マスマティカル・サイエンティスト」「マスマティクス・ティーチャー」「ニューヨークタイムズ」等の媒体で細部まで議論され、その結果、サヴァントの解答は基本的に正しいとされたとのことである[4]

ゲームのルール

(1) 3つのドア (A, B, C) に(景品、ヤギ、ヤギ)がランダムに入っている。
(2) プレーヤーはドアを1つ選ぶ。
(3) モンティは残りのドアのうち1つを必ず開ける。
(4) モンティの開けるドアは、必ずヤギの入っているドアである。
(5) モンティはプレーヤーにドアを選びなおしてよいと必ず言う。

このうち (3) と (4) の条件が重要である(ベイズの定理でいう事後確率が有効になる)。 もし (3) が決められていなければ、例えば開けるかどうかモンティが決められるなら、このゲームはプレーヤーとモンティの心理戦であり、確率の問題ではない。 また、(4) の条件次第では答えが逆になったり、答えを定めることができなくなる。つまり、モンティが景品を出してしまう可能性があるなら、問題の大前提が変わってしまう。

大騒ぎとなった原因のひとつは、ルールに対する数学的な説明が無く「解釈」の余地があったことで、数学的に正しいルールが決まるまで決着が付かなかった。事後確率の例題としては、ルールはもちろん守られており、司会者モンティとプレーヤーの参加者はルールを事前に把握して、その他の者は番組の視聴者(である)という大前提があるが、この前提がプロ数学者らの盲点を突く事になる。エルデシュはこの問題の解答を最初に間違いだと断定、立腹して外出する。一時間程経過してから帰って来るはずの時間ではないエルデシュがカンカンに怒って帰ってきてこの問題(と解)をエルデシュに教えた弟子を「君はなぜ選択を変更するのか言ってくれなかった!どうして言わなかったのか!」といらだった様子で問い詰める。これには弟子も説明が出来ず師に謝罪。エルデシュは益々不機嫌になったという。

直感と理論の乖離

この問題を巡る人々の反応は、冒頭のエピソードにある様に『どちらを選んでも変わらない』とする意見が多かった。

ドアが2つになった時点でプレーヤーが改めてコイントスによって決めなおしたと仮定すると、景品を得る確率は1/2となる。 ところが、2枚のドアの価値はルール (1) - (4) で確率の高い(価値のある)選択をすることが可能となっている。つまり、『どちらを選んでも変わらない』は誤りである。

以下のように考えると直感でも理解しやすい。

ハズレに色を付ける方法

  • ドアの位置は考えなくても良い。
  • 最初の選択で発生するのが3パターン(当たりか、ハズレ (青) か、ハズレ (赤))だと覚えておく
  最初の選択  残りのドアの中身(位置は考えなくてよい)
    ↓       ↓ 
A 「当たり」    /  ハズレ (青) ・ ハズレ (赤)
 
B ハズレ (青) /  「当たり」   ・ ハズレ (赤) 
 
C ハズレ (赤) /  ハズレ (青) ・ 「当たり」 
  •  最初の選択で当たりを引けるケースは1つ (A) 、ハズレを引いてしまうケースは2つ (B,C) ある。
  •  2回目の選択ではハズレが1つ除外されているため、当たりをひくケースは2つ (B,C) 。ハズレを引くケースは1つ (A) となる。

ポイント

  • 最初に自分がハズレを引いていれば、2回目はドアを変えれば確実に当たりが出る(残りのハズレが除外されているため)。
  • 最初に当たりを引いているケースは1つしかないが、ハズレを引いているケースは2つあるので、変えるほうが得である。

ワナ

  • 「最初にハズレを引くケースは1つ多い」を忘れていると、2回目の確率が50%に見えてしまうこと。
  • 最初にハズレを引くケースは2つあるので、確率は50%ではない。

ドアに印を付ける方法

  1. そのドアに景品が入っていることを ○ で示す。
  2. ドア A,B,C が ○ である確率は、それぞれ 1/3 である。
  3. 「ドア A が ○ である確率」は 1/3 であるが、「B または C が ○ である確率」は 2/3 である。
  4. ドア C を開いたあとでも、「B または C が ○ である確率」は 2/3 である。
  5. ドア C を開いて、C が ○ ではないと判明したあとでは、「B が ○ である確率」は、「B または Cが ○ である確率」と等しい[5]。その確率は 2/3 である。
  6. 「A が ○ である確率」は 1/3 であるが、「B が ○ である確率」は 2/3 である。

最初にハズレのドアを選ぶ方法

  1. 当たりのドアを選ぼうとせず、わざとハズレのドアを選ぶ。
  2. その後モンティが、もう一つのハズレのドアがどれかを教えてくれるので、残ったドアが当たりのドアである。
  3. 当たりのドアがどれか判明したので、最初に選んだハズレのドアから当たりのドアに変更する。

最初にハズレのドアを選ぶことができれば、上記手順で確実に当たりのドアを開けることができる。最初にハズレのドアを選ぶことができる確率は2/3であるので、この手順に従えば(つまりドアを変更すれば)2/3の確率で当たりのドアを開けることができる。

この1.の「当たりのドアを選ぶ」か「ハズレのドアを選ぶ」かは気持ちの問題であり、確率的な影響はまったくないことに注意を要する。3.でドアを変更することへの抵抗感をなくす効果しか持っていない。

よって2.においてモンティが「もう一つのハズレのドアがどれかを教えてくれる」のではなくモンティも当てようとする(モンティが当てたらプレーヤーは自動的に外れる)場合には、1/3の確率で2.でモンティが当ててしまうので、3.にたどり着くのはモンティが2/3の確率で外した場合に限る。この場合3.にたどり着いた時点で残る確率は、変更すると当たる確率1/3(2/3だった確率のうち1/3をモンティが使って(そして外して)しまった)と、変更すると外れる確率1/3とになり、ドアを変更してもしなくても確率は等しいという直感通りの確率になる。

つまり、2.でモンティが2/3の確率のうち1/3を使ってハズレのドアを開けてしまうのではなく、確実に(確率を減らさずに)ハズレのドアを開けることが直感通りにならない要因である。

これを変形させた考え方もできる。

  1. 最初プレーヤーがあたりを引く確率は1/3である。
  2. ドアを変更しない場合はそのまま1/3の確率である(変更しないのであればモンティがドアを開こうが開くまいが確率は変わらない)。
  3. モンティがドアを開けた後にドアを変更する場合、最初に選択したドアがハズレであれば変更後のドアはあたりが確定である。つまり、最初に選択したドアがはずれである確率=ドアを変更した場合にあたりを引く確率である。
  4. 最初の選択であたりを引く確率は1/3、はずれを引く確率は2/3である。
  5. ゆえに、ドアを変更した場合のあたりを引く確率は2/3と考えられる。

100枚のドアを使う方法

  1. ゲームには100枚のドアが使われるとする。プレーヤーが最初のドアを選んだとき、このドアの当たりの確率は100分の1である。
  2. モンティが残り99枚のドアのうち98枚を開けてヤギを見せる。
  3. プレーヤーは2回目の選択をする。

最初にプレーヤーが選んだ1枚のドアと「正解を知っているモンティが開こうとしなかった、残り99枚のうちで、ただ1枚のドア」の確率が相違していることは、直感で理解が可能であろう。

その他の方法

あるいは、こう考えることもできる。

  1. プレーヤーは1回目の選択をする。この時点では確率は全て等しい。
  2. 番組側は残りのドアをひとまとめにし、どれを開けても結果は共通と宣言する。
  3. プレーヤーは2回目の選択をする。

プレーヤーが最初に選択することにより、ひとまとめの対象から(番組側から見てランダムに)外されたドアと、残りすべてのドアでは、価値が等しくないことは明らかである。

また、確率論の基になっている統計の考え方を呼び起こすことで、理解を助けられた実験がある[6][7]

パラドックス

この問題はパラドックスであるといわれることがある。最初からドアが1つ開いた状態で、2つのドアから1つを選ぶという問題であったなら、確率は 1/2 である。それに対して、このゲームによってドアが1つ開いた状態になった場合には、確率は 1/3 と 2/3 になる。このように確率が異なることがパラドックスといわれる理由である。

しかし、これは確率の計算に矛盾があるわけではないので、擬似パラドックスである。ドアが2択になった経緯を知っているか知らないかの情報の差がドアの評価に影響しているだけである(単純な話、「最初にプレーヤーがドアを選択する時点での確率」と考えると理解しやすい。なお、1つドアが初めから開いた状態=単なる2択問題であり、モンティ・ホール問題は成立し得ない)。

計算

ファイル:Monty closed doors.svg
最初の状態
プレーヤーが選んだ1番のドアが当たりの確率は1/3、残り2枚のドアが当たりの確率は2/3。
ファイル:Monty open door chances.svg
モンティがドアを開いた後
「残り2枚のドアが当たる確率 = 2/3」は変化していないが、そのうち1枚が消えたことで、2/3の確率は2番のドアに集中する。

開けるドアを変更すると、プレーヤーが景品を獲得する確率が2倍になる根拠は以下のようになる。プレーヤーが初めに選んだドアをA、残りのドアをB、Cとする。プレーヤーが初めのドアを選んだ時点で、それぞれのドアに景品がある確率と、モンティがそれぞれのドアを開ける確率を表にすると次のようになる。

プレーヤーが初めのドアを選んだ時点の確率
  モンティが開けるドア合計
A (プレーヤー)BC
景品があるドア A01/61/61/3
B001/31/3
C01/301/3
合計01/21/21

ここでモンティがBのドアを開ける確率は全体の1/2であるが、これは、Aのドアに景品があってモンティがBのドアを開ける確率 (1/6) 、Bのドアに景品があってモンティがBのドアを開ける確率 (0) 、Cのドアに景品があってモンティがBのドアを開ける確率 (1/3) の合計である。表をよく見れば分かるとおり、もしモンティがBのドアを開けたならば、A(プレーヤーが初めに選んだドア)の後ろに景品がある確率に比べ、Cの後ろに景品がある確率が2倍なのは明らかである。

また、当たりのドアを選ぶ確率は 1/3、ハズレのドアを選ぶ確率は 2/3 である。当たりを選んだとき第2のドアで当たる確率は 0%、ハズレを選んだとき第2のドアで当たる確率は 100% である。したがって、

第2のドアで当たる確率 = (1/3)×0 + (2/3)×1 = 2/3

同様にして、

最初のドアで当たる確率 = (1/3)×1 + (2/3)×0 = 1/3

この結果を次のように考えることができる。第2のドアに替えた場合、最初に当たりだとハズレになり、逆にハズレだと当たりになる。したがって、最初のドアで「当たり、ハズレ、ハズレ」が起こっていたものが、第2のドアでは「ハズレ、当たり、当たり」が起こることになる。すなわち、第2のドアでは「当たり」と「ハズレ」の確率が完全に逆転する。

最初のドアでは「ハズレ」の方が多いので、当然「当たり」の方が多くなる第2のドアを選択すべきである。当たる確率は 1/3 から 2/3 へ増加し、1/3 増えることになる。

ファイル:Monty problem monte carlo.svg
当たる確率のシミュレーション
青:変更せず / 赤:変更する

シミュレーション

簡単なプログラムでシミュレーションを行い、答えを導くこともできる(図)。このグラフでは、変更したドアに景品があった回数の累計が、変更しなかった場合の約2倍となっている。

変形問題

ルールを変更することで例題の理解を助けたり、統計論の別の課題を説明する試みが行われている。

変更ルール1

(4) モンティは景品のあるドアを知っている。どちらを開けるかコイントスで決めるが、選んだドアが景品の場合はもう片方のドアに変更する。

このルールは結局ドアの選び方に変化はないので、解答は「開けるドアを変更する」である。

変更ルール2

(4) モンティは景品のあるドアを知らない。どちらを開けるかコイントスで決めるが、選んだドアが景品の場合は番組スタッフが中身を入れ替える。

これは、前のルールで最後にモンティがドアの選択を変更していたところをスタッフが代わりにやっているだけであり、解答は「開けるドアを変更する」である。

このルールではドアを変更したほうがよいことが直感的に分かる。残ったドアに景品が移動してくることはあっても、出ていくことはないからである。数値で示すと、プレーヤーが最初から正解していた確率は 1/3、モンティが正解して景品が移動した確率も 1/3、二人ともハズレであった確率も 1/3 である。景品は必ず最後の扉に移動するので、最後の扉に景品がある確率は 2/3 である。

変更ルール3

(4) モンティはどちらを開けるかコイントスで決め、中身にかかわらず開ける。

モンティが景品を出してしまった場合はゲーム終了と仮定して、モンティがヤギを出したらプレーヤーはドアを変更すべきだろうか?この場合の正解はどっちを選んでも確率は 1/2 となり、変更してもしなくてもよいのである。

モンティが景品を出す確率は1/3、ヤギを出す確率は 2/3 である。景品を出したらゲームは終了するので、ヤギを出した場合の2/3の内訳を考えると、プレーヤーが選んだドアに景品がある確率1/3と、最後のドアにある確率1/3になる。 この場合、プレーヤーもモンティも正解に関係なくドアを選ぶので、先に景品を入れる必要はなく、後から景品の位置をランダムに決めても結果は等価となる。

変更ルール4

(3) モンティは景品のあるドアを知っている。コイントスでヤギのドアの片方を選び、プレーヤーの選択にかかわらず開ける。

モンティがプレーヤーの選んだドアを選んだ場合はゲーム終了と仮定して、モンティがヤギを出したらプレーヤーはドアを変更すべきだろうか?この場合も変更ルール3同様、変更してもしなくてもよいのである。

変更ルール5

(3) モンティは景品のあるドアを知っている。最初にプレーヤーが景品のあるドアを選んだ時に限り、ドアを開ける。

このように変更すると、モンティがドアを開けない場合がある。もし、偶然にもモンティがドアを開けたとすると、プレーヤーはドアを変更すべきだろうか?この場合は当然答えは「開けるドアを変更しない」である。 このことから、モンティがドアを必ず開けるというルールは非常に重要だということが分かる。

悪魔モンティ

(5) モンティは景品のあるドアを知っていて、プレーヤーが景品のあるドアを選んだ時だけ、変更してよいという[8]

天使モンティ

(5) モンティは景品のあるドアを知っていて、プレーヤーがヤギのいるドアを選んだ時だけ、変更してよいという[8]

心理戦

プレーヤーとモンティの心理戦を想定した例題も試みられている。駆け引きの内容を数値化することで、統計論的に解を求めることができる。

(5) モンティは景品のあるドアを知っていて、プレーヤーが景品のあるドアを選んだ時は100%の確率で、ヤギのいるドアを選んだ時は50%の確率で、プレーヤーが選ばなかったヤギのいるドアを開けて見せ、変更してよいという。

ナッシュ均衡による解では、変更したときに景品を得る確率は1/2となる。つまり、変更してもしなくても変わらない[8]

数学的解説

もとの例題ではルール (3) と (4) が重要とされるのが一般的だが、実はもう一つ重要な前提がある。それは、「プレーヤーが最初に当たりを選んだ場合に、モンティが残るドアのどちらを開けるかについて "癖がない(ランダムに選ぶ)" ことだ。例えば「プレーヤーが最初に当たりのドアAを選んだ場合は、モンティは必ずBを開く」という可能性があるとすれば、「マリリンの解答は間違っている」というのは必ずしも間違いではない。ここで、「癖がない(ランダムに選ぶ)」ことがいかに重要であるか、具体的に説明する。

プレーヤーがドアAを選んだ場合にモンティがドアBを選択する(選択して開ける)確率を x とすると、ドアBが開いた(もちろん外れ)という条件のもとで、ドアAが当たりである確率は x/(1+x)となる(もちろん、ドアCが当たりである確率は 1/(1+x)である)。

計算法

ドアBが開いたということは、プレーヤーがドアCを選択したかドアAを選択したということである。ドアCを選択した場合は必ず(確率1で)ドアBを開き、ドアAを選択した場合は、確率 x でドアBを開くのであるから、ドアBが開いたという条件で、ドアAが当たりである確率は、xを1+x で割れば求められる。

よって、確率 x が0から1の間の数値を取るとすれば、ドアAが当たりである確率は0から1/2まで変化する(ドアCが当たりである確率は1から1/2まで変化する)。ドアB、Cをランダムに(x=1/2 の確率で)選択したときに限って、ドアAが当たりの確率は1/3のまま(ドアCが当たりの確率は当初の1/3から2/3に上がる)となる。マリリンの答えは、この特殊な条件を想定したものである。確かに常識的仮定だが、数学的には当然視できるものではない。

脚注

  1. 取り引き、駆け引き、のるかそるか、の意。なお、日本でも1979年に東京12チャンネル(当時)の「ザ・テレビジョン」内で「仰天がっぽりクイズ」という邦題で放送されたことがある。
  2. ムロディナウ 2009, p. 71
  3. サヴァント 2002, pp. 5-16
  4. サヴァント 2002, pp. 183ff
  5. 確率論の法則による。集合の和についての確率の値。
  6. 小林厚子「確率判断の認知心理(1) (PDF) 」 、『東京成徳大学研究紀要』第5号、東京成徳大学、1998年、 pp. 89-100。
  7. 小林厚子「確率判断の認知心理(2) (PDF) 」 、『東京成徳大学研究紀要』第6号、東京成徳大学、1999年、 pp. 137-146。
  8. 8.0 8.1 8.2 英語版(22:38, 4 July 2010)

参考文献

関連項目

外部リンク