Парадокс Монти Холла
Парадокс Монти Холла — одна из известных задач теории вероятностей, решение которой, на первый взгляд, противоречит здравому смыслу. Эта задача не является парадоксом в узком смысле этого слова, так как не содержит в себе противоречия, она называется парадоксом потому, что её решение может показаться неожиданным. Более того, многим людям бывает сложно принять правильное решение даже после того, как его им рассказали[1].
Задача впервые была опубликована[2][3] (вместе с решением) в 1975 году в журнале «The American Statistician» профессором Калифорнийского университета Стивом Селвином. Она стала популярной после появления в журнале «Parade» в 1990 году[4].
Формулировка
Задача формулируется как описание игры, основанной на американской телеигре «Let’s Make a Deal», и названа в честь ведущего этой передачи. Наиболее распространённая формулировка этой задачи, опубликованная в 1990 году в журнале Parade Magazine, звучит следующим образом:
Представьте, что вы стали участником игры, в которой вам нужно выбрать одну из трёх дверей. За одной из дверей находится автомобиль, за двумя другими дверями — козы. Вы выбираете одну из дверей, например, номер 1, после этого ведущий, который знает, где находится автомобиль, а где — козы, открывает одну из оставшихся дверей, например, номер 3, за которой находится коза. После этого он спрашивает вас — не желаете ли вы изменить свой выбор и выбрать дверь номер 2? Увеличатся ли ваши шансы выиграть автомобиль, если вы примете предложение ведущего и измените свой выбор?
После публикации немедленно выяснилось, что задача сформулирована некорректно: не все условия оговорены. Например, ведущий может придерживаться стратегии «адский Монти»: предлагать сменить выбор тогда и только тогда, когда игрок первым ходом выбрал автомобиль. Очевидно, что смена первоначального выбора будет вести в такой ситуации к гарантированному проигрышу (см. ниже).
Наиболее популярной является задача с дополнительным условием[5] — участнику игры заранее известны следующие правила :
- автомобиль равновероятно размещён за любой из трёх дверей;
- ведущий знает, где находится автомобиль;
- ведущий в любом случае обязан открыть дверь с козой (но не ту, которую выбрал игрок) и предложить игроку изменить выбор;
- если у ведущего есть выбор, какую из двух дверей открыть (то есть, игрок указал на верную дверь, и за обеими оставшимися дверями — козы), он выбирает любую из них с одинаковой вероятностью.
В нижеследующем тексте обсуждается задача Монти Холла именно в этой формулировке.
Разбор
Дверь 1 | Дверь 2 | Дверь 3 | Результат, если менять выбор | Результат, если не менять выбор |
---|---|---|---|---|
Авто | Коза | Коза | Коза | Авто |
Коза | Авто | Коза | Авто | Коза |
Коза | Коза | Авто | Авто | Коза |
Для стратегии выигрыша важно следующее: если вы меняете выбор двери после действий ведущего, то вы выигрываете, если изначально выбрали проигрышную дверь. Это произойдёт с вероятностью 2⁄3, так как изначально выбрать проигрышную дверь можно 2 способами из 3.
Но часто при решении этой задачи рассуждают примерно так: ведущий всегда в итоге убирает одну проигрышную дверь, и тогда вероятности появления автомобиля за двумя не открытыми становятся равны ½, вне зависимости от первоначального выбора. Но это неверно: хотя возможностей выбора действительно остаётся две, эти возможности (с учётом предыстории) не являются равновероятными. Это так, поскольку изначально все двери имели равные шансы быть выигрышными, но затем имели разные вероятности быть исключёнными.
Для большинства людей этот вывод противоречит интуитивному восприятию ситуации, и благодаря возникающему несоответствию между логическим выводом и ответом, к которому склоняет интуитивное мнение, задача и называется парадоксом Монти Холла.
Следует иметь в виду, что первый выбор двери игроком влияет на то, из каких двух оставшихся дверей будет выбирать Монти.
Ещё более наглядной ситуация с дверями становится, если представить что дверей не 3, а, скажем 1000, и после выбора игрока ведущий убирает 998 лишних, оставляя 2 двери: ту, которую выбрал игрок и ещё одну. Представляется более очевидным, что вероятности нахождения приза за этими дверьми различны, и не равны ½. Если мы меняем дверь, то проигрываем только в том случае, если с самого начала выбрали призовую дверь, вероятность чего 1:1000. Выигрываем же мы при смене двери в том случае, если наш изначальный выбор был неправильным, а вероятность этого — 999 из 1000. В случае с 3 дверьми логика сохраняется, но вероятность выигрыша при смене решения соответственно 2⁄3, а не 999⁄1000.
Другой способ рассуждения — замена условия эквивалентным. Представим, что вместо осуществления игроком первоначального выбора (пусть это будет всегда дверь № 1) и последующего открытия ведущим двери с козой среди оставшихся (то есть всегда среди № 2 и № 3), игроку нужно угадать дверь с первой попытки, но ему предварительно сообщается, что за дверью № 1 автомобиль может быть с исходной вероятностью (33 %), а среди оставшихся дверей указывается за какой из дверей автомобиля точно нет (0 %). Соответственно, на последнюю дверь всегда будет приходиться 67 %, и стратегия её выбора предпочтительна.
Ещё более наглядное рассуждение — заранее зная полные условия игры (то, что выбор предложат поменять) и заранее с этими условиями согласившись, игрок фактически в первый раз выбирает дверь, за которой приза, по его мнению, нет (и может ошибиться с вероятностью 1⁄3). Одновременно, косвенно он указывает на оставшиеся две двери, за одной из которых приз, по его мнению, есть, что даёт шанс на выигрыш 2⁄3. Это эквивалентно игре, в которой ведущий бы в самом начале однократно предлагал игроку исключить одну "лишнюю" дверь и гарантированно открыть две оставшиеся.
Интуитивно понятное объяснение - есть 111 наборов из 3 дверей.
- Игрок во всех 111 наборах делает свой первоначальный выбор. Известно, что он угадал в 37 наборах.
- Ведущий убирает из всех 111 наборов по 1 двери.
- Мы получаем 111 наборов с двумя дверьми, где уже сделан первый выбор.
- В этих 111 наборах правильно выбрано 37 раз.
- Если игрок поменяет свой выбор все 111 раз, то эти 37 окажутся неправильными, но тогда все оставшиеся 74 - правильными.
Другое поведение ведущего
Классическая версия парадокса Монти Холла утверждает, что ведущий обязательно предложит игроку сменить дверь, независимо от того, выбрал тот машину или нет. Но возможно и более сложное поведение ведущего. В этой таблице кратко описаны несколько вариантов поведения. Если не сказано противное, призы равновероятно расположены за дверями, ведущий знает, где автомобиль, а если есть выбор — равновероятно выбирает из двух коз. Если ведущий влияет на вероятности, а не следует жёсткой процедуре, то его цель — уберечь автомобиль от испытуемого. Цель испытуемого, соответственно, его забрать.
Поведение ведущего | Результат |
---|---|
«Адский Монти»: ведущий предлагает сменить, если дверь правильная[4]. | Смена всегда даст козу. |
«Ангельский Монти»: ведущий предлагает сменить, если дверь неправильная[6]. | Смена всегда даст автомобиль. |
«Несведущий Монти» или «Монти Бух»: ведущий нечаянно падает, открывается дверь, и оказывается, что за ней не машина. Другими словами, ведущий сам не знает, что за дверями, открывает дверь полностью наугад, и только случайно за ней не оказалось автомобиля[7][8][9]. | Смена даёт выигрыш в ½ случаев. Именно так устроено американское шоу «Deal or No Deal» — правда, случайную дверь открывает сам игрок, и если за ней нет автомобиля, ведущий предлагает сменить. |
Ведущий выбирает одну из коз и открывает её, если игрок выбрал другую дверь. | Смена даёт выигрыш в ½ случаев. |
Ведущий всегда открывает козу. Если выбран автомобиль, левая коза открывается с вероятностью p и правая с вероятностью q=1−p.[8][9][10] | Если ведущий открыл левую дверь, смена даёт выигрыш с вероятностью . Если правую — . Однако испытуемый никак не может повлиять на вероятность того, что будет открыта правая дверь — независимо от его выбора это произойдёт с вероятностью . |
То же самое, p=q=½ (классический случай). | Смена даёт выигрыш с вероятностью 2⁄3. |
То же самое, p=1, q=0 («бессильный Монти» — усталый ведущий стоит у левой двери и открывает ту козу, которая ближе). | Если ведущий открыл правую дверь, смена даёт гарантированный выигрыш. Если левую — вероятность ½. |
Ведущий открывает козу всегда, если выбран автомобиль, и с вероятностью ½ в противном случае.[11] | Смена даёт выигрыш с вероятностью ½. |
Общий случай: игра повторяется многократно, вероятность спрятать автомобиль за той или иной дверью, а также открыть ту или иную дверь произвольная, однако ведущий знает, где автомобиль, и всегда предлагает смену, открывая одну из коз.[12][13] | Равновесие Нэша: ведущему выгоднее всего именно парадокс Монти Холла в классическом виде (вероятность выигрыша 2⁄3). Машина прячется за любой из дверей с вероятностью ⅓; если есть выбор, открываем любую козу наугад. |
То же самое, но ведущий может не открывать дверь вообще. | Равновесие Нэша: ведущему выгодно не открывать дверь, вероятность выигрыша ⅓. |
Вариант: задача трёх узников
Задача предложена Мартином Гарднером в 1959 году.
Трое заключённых, A, B и С, заключены в одиночные камеры и приговорены к смертной казни. Губернатор случайным образом выбирает одного из них и милует его. Стражник, охраняющий заключённых, знает, кто помилован, но не имеет права сказать этого. Заключённый A просит стражника сказать ему имя того (другого) заключённого, кто точно будет казнён: «Если B помилован, скажи мне, что казнён будет C. Если помилован C, скажи мне, что казнён будет B. Если они оба будут казнены, а помилован я, подбрось монету, и скажи имя B или C».
Стражник говорит заключённому A, что заключённый B будет казнён. Заключённый A рад это слышать, поскольку он считает, что теперь вероятность его выживания стала ½, а не ⅓, как была до этого. Заключённый A тайно говорит заключённому С, что B будет казнён. Заключённый С также рад это слышать, поскольку он всё ещё полагает, что вероятность выживания заключённого А — ⅓, а его вероятность выживания возросла до 2⁄3. Как такое может быть?
Разбор
Знакомый с парадоксом Монти Холла теперь знает, что прав C и не прав A.
- Помилуют A, стражник сказал B — вероятность 1⁄6.
- Помилуют A, стражник сказал C — вероятность тоже 1⁄6.
- Помилуют B, стражник сказал C — вероятность ⅓.
- Помилуют C, стражник сказал B — вероятность тоже ⅓.
Так что фраза «Казнят B» оставляет 1-й и 4-й варианты — то есть 2⁄3 вероятности, что помилуют C, и ⅓, что A.
Люди думают, что вероятность ½, потому что они игнорируют суть вопроса, который заключённый A задаёт стражнику. Если бы стражник мог ответить на вопрос «Будет ли заключенный B казнён?», тогда в случае положительного ответа вероятность казни А действительно бы уменьшалась с 2⁄3 до ½.
К вопросу можно подойти и с другой стороны: если A помилуют, стражник скажет любое имя наугад; если A казнят — стражник скажет того, кого казнят вместе с A. Так что вопрос не даст A никакого дополнительного шанса на помилование.
См. также
Примечания
- Воронцов, И.Д., Райцин, А.М. ПАРАДОКС МОНТИ ХОЛЛА // ТЕЛЕКОММУНИКАЦИИ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ. — 2015. — № 2. — С. 7.
- Selvin, Steve. A problem in probability (letter to the editor) (англ.) // American Statistician : journal. — Vol. 29, no. 1. — P. 67. — .
- Selvin, Steve. On the Monty Hall problem (letter to the editor) (англ.) // American Statistician : journal. — Vol. 29, no. 3. — P. 134. — .
- Tierney, John (July 21, 1991), Behind Monty Hall's Doors: Puzzle, Debate and Answer?, The New York Times, <https://query.nytimes.com/gst/fullpage.html?res=9D0CEFDD1E3FF932A15754C0A967958260>. Проверено 18 января 2008.
- The Monty Hall Problem, Reconsidered. Martin Gardner in the Twenty-First Century
- Granberg, Donald (1996). «To Switch or Not to Switch». Appendix to vos Savant, Marilyn, The Power of Logical Thinking. St. Martin’s Press. ISBN 0-312-30463-3, (restricted online copy в «Книгах Google»).
- Granberg, Donald and Brown, Thad A. (1995). "The Monty Hall Dilemma, " Personality and Social Psychology Bulletin 21(7): 711—729.
- Rosenthal, Jeffrey S. Monty Hall, Monty Fall, Monty Crawl (англ.) // Math Horizons : magazine. — 2005a. — P. September issue, 5—7. Online reprint, 2008.
- Rosenthal, Jeffrey S. (2005b): Struck by Lightning: the Curious World of Probabilities. Harper Collings 2005, ISBN 978-0-00-200791-7.
- Morgan, J. P., Chaganty, N. R., Dahiya, R. C., & Doviak, M. J. (1991). "Let’s make a deal: The player’s dilemma, " American Statistician 45: 284—287.
- Mueser, Peter R. and Granberg, Donald (May 1999). «The Monty Hall Dilemma Revisited: Understanding the Interaction of Problem Definition and Decision Making», University of Missouri Working Paper 99-06. Retrieved June 10, 2010.
- Gill, Richard (2010) Monty Hall problem. pp. 858—863, International Encyclopaedia of Statistical Science, Springer, 2010. Eprint
- Gill, Richard (2011) The Monty Hall Problem is not a probability puzzle (it’s a challenge in mathematical modelling). Statistica Neerlandica 65(1) 58-71, February 2011. Eprint
Ссылки
- Объясняющий видеоролик на сайте Smart Videos .ru
- Weisstein, Eric W. Парадокс Монти Холла (англ.) на сайте Wolfram MathWorld.
- Парадокс Монти Холла на сайте телешоу Let’s Make a deal
- Ron Clarke Парадокс Монти Холла
- Отрывок из книги С.Лукьяненко, в котором используется парадокс Монти Холла
- Ещё одно решение по Байесу Архивная копия от 4 марта 2016 на Wayback Machine Ещё одно решение по Байесу на форуме Новосибирского Государственного Университета
- Реализация симулятора парадокса Монти Холла на разных языках (на сайте Rosetta Code)
- Наглядный пример действия парадокса Монти Холла (русск.)
- Приз за одной из трёх дверей
Литература
- Гмурман В. Е. Теория вероятностей и математическая статистика, — М.: Высшее образование. 2005
- Gnedin, Sasha «The Mondee Gills Game.» (недоступная ссылка) Журнал The Mathematical Intelligencer, 2011
- Савант, Мэрилин вос. Колонка «Ask Marilyn», журнал Parade Magazine от 17 февраля 1990.
- Савант, Мэрилин вос. Колонка «Ask Marilyn», журнал Parade Magazine от 26 февраля 2006.
- Bapeswara Rao, V. V. and Rao, M. Bhaskara. «A three-door game show and some of its variants». Журнал The Mathematical Scientist, 1992, № 2.
- Tijms, Henk. Understanding Probability, Chance Rules in Everyday Life. Cambridge University Press, New York, 2004. (ISBN 0-521-54036-4)