Равновесие дрожащей руки

Равновесие дрожащей руки
Равновесие дрожащей руки
	Концепция решения в теории игр
Связанные множества решений
Надмножества	Равновесие Нэша
Подмножества	Собственное равновесие
Факты
Авторство	Рейнхард Зельтен

Равновесие дрожащей руки (англ. trembling hand perfect equilibrium) — принцип оптимальности в некооперативных играх, представляющий собой равновесие Нэша, обладающее дополнительным свойством устойчивости к достаточно малым отклонениям игроков от равновесных стратегий. Сформулировано Р. Зельтеном в работе 1975 года[1].

Формальное определение

Пусть задана игра в нормальной форме $\Gamma =<I,\{X_{i}\}_{i\in I},\{H_{i}\}_{i\in I}>$ . Набор смешанных стратегий игроков q называется равновесием дрожащей руки, если существует такая последовательность вполне смешанных стратегий {p_ε} → q, что стратегия q_i является наилучшим ответом игрока i на стратегии остальных игроков из набора p_ε.

Как и равновесие Нэша, равновесие дрожащей руки существует в смешанном расширении в любой некооперативной игре с конечными множествами стратегий игроков.

Пример

Приведенная в таблице игра двух лиц отображенная в нормальной форме имеет два равновесия Нэша: (Верх, Лево) and (Низ, Право). Однако, только (В, Л) является равновесием дрожащей руки.

	Лево	Право
Верх	1, 1	2, 0
Низ	0, 2	2, 2

Соотношение равновесных концепций решения. Стрелками обозначено направление от рафинирований к менее требовательным концепциям

Действительно, предположим, что игрок 1 использует смешанную стратегию $(1-\epsilon ,\epsilon )$ , для некоторого $0<\epsilon <1$ . Ожидаемый выигрыш игрока 2, если он играет Лево, составит:

1(1-\epsilon )+2\epsilon =1+\epsilon

.

Ожидаемый выигрыш игрока 2 при выборе стратегии Право составит:

0(1-\epsilon )+2\epsilon =2\epsilon

.

Для достаточно малых значений ε, игрок 2 максимизирует свой ожидаемый выигрыш, используя стратегию Право с минимальным весом. Аналогично, игрок 1 должен использовать с минимальным весом стратегию Низ, если игрок 2 использует смешанную стратегию $(1-\epsilon ,\epsilon )$ . Следовательно, (В, Л) является равновесием дрожащей руки.

Аналогичные рассуждения не выполняются для профиля стратегий (Н, П). Действительно, предположим, что игрок 1 использует смешанную стратегию $(\epsilon ,1-\epsilon )$ . Ожидаемый выигрыш игрока 2, если он использует Л, составит:

1\epsilon +2(1-\epsilon )=2-\epsilon

.

Ожидаемый выигрыш игрока 2 при использовании стратегии П:

0(\epsilon )+2(1-\epsilon )=2-2\epsilon

.

В этом случае для любых положительных значений ε, игрок 2 максимизирует свой ожидаемый выигрыш, используя П с минимальной частотой. Следовательно, (Н, П) не является равновесием дрожащей руки, так как при небольшой вероятности ошибок игрок 2 максимизирует свой ожидаемый выигрыш, отклоняясь от данной стратегии.

Ссылки

Selten, R. A reexamination of the perfectness concept for equilibrium points in extensive games (англ.) // International Journal of Game Theory : journal. — 1975. — Vol. 4. — P. 25—55.

Литература

Зелтен, Р., Харшаньи, Д. Общая теория выбора равновесия в играх. — СПб.: Экономическая школа, 2001.
Печерский, С. Л., Беляева, А. А. Теория игр для экономистов. Вводный курс. (Учебное пособие) — СПб.: Изд-во Европейского университета, 2001.
Selten, R. Evolutionary stability in extensive two-person games // Math. Soc. Sci. — 1983. — Vol. 5. — P. 269—363.
Selten, R. Evolutionary stability in extensive two-person games — correction and further development // Math. Soc. Sci. — 1988. — Vol. 16. — P. 223—266.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[1] Selten, R. A reexamination of the perfectness concept for equilibrium points in extensive games (англ.) // International Journal of Game Theory : journal. — 1975. — Vol. 4. — P. 25—55.

Теория игр
Основные понятия	Взаимное и общее знание Игрок Иерархия вер Иррациональное усиление Стратегия (доминирование) Обратная индукция
Виды игр	Одновременные, последовательные и повторяющиеся Некооперативные и кооперативные С полной, неполной, совершенной и несовершенной информацией В нормальной и развёрнутой форме Антагонистические Дифференциальные Стохастические Битва полов Охота на оленя
Концепции решения	Доминирование по риску Коррелированное равновесие Равновесие дрожащей руки Равновесие Нэша Равновесие, совершенное по подыграм Рационализируемость Секвенциальное равновесие Сильное равновесие Собственное равновесие Эволюционно стабильная стратегия Эпсилон-равновесие Эффективность по Парето Ядро
Примеры игр	Дилемма заключённого Задача бара «Эль Фароль» Модель Бертрана Модель Курно Модель Штакельберга Орлянка Трагедия общих ресурсов Ястребы и голуби
Эпистемическая теория игр Дизайн механизмов Справедливый делёж