Цена стабильности

Цена стабильности (англ. price of stability, PoS) для игры — отношение оптимального значения целевой функции в одном из её равновесных состояний и оптимального исхода. Цена стабильности имеет смысл для игр, где есть некая высшая сила или условия игры, которые как-то влияют на положение игроков и могут помочь им сойтись к равновесию Нэша. При измерении эффективности равновесия Нэша в какой-либо игре, имеет смысл рассматривать и цену анархии (англ. Price of Anarchy, PoA).

Примеры

PoS можно выразить следующим образом:

Здесь  — значение лучшего равновесия Нэша,  — значение оптимального решения.

В приведённой ниже игре «Дилемма заключённого» игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах, поскольку имеется единственное равновесие (), мы имеем .

Дилемма заключённого
(2,2)(0,3)
(3,0)(1,1)

В этом примере, который является версией игры «битва полов», имеются две точки равновесия, () и () со значениями 3 и 15 соответственно. Оптимальным значением является 15. Тогда , в то время как .

Битва полов
(2,1)(0,0)
(0,0)(5,10)

Предпосылки и вехи

Цену стабильности первыми изучали А. Шульцан и Н. Мозес, а сам термин появился в работах Е. Аншелевича. Они показали, что равновесие Нэша в чистых стратегиях всегда существует, и цена стабильности этой игры не превосходит гармонического числа n в ориентированных графах. Для неориентированных графов Аншелевич и другие представили жёсткую границу стабильности в 4/3 для случая одного источника и двух игроков. Йен Ли доказал, что для неориентированных графов с различными точками назначения для всех игроков, с которыми все игроки должны иметь связь, цена стабильности потока игры на построение сети Шепли равна где  — число игроков. С другой стороны цена анархии для игры равна примерно .

Игры на построение сети

Условия игры

Игры построения сети имеют очень естественное обоснование для цены стабильности. В этих играх цена анархии может быть намного хуже цены стабильности.

Пример следующей игры:

  • игроков;
  • Целью каждого игрока является соединение вершин и в ориентированном графе ;
  • Стратегиями для игрока являются все пути из в в графе ;
  • Каждая дуга имеет цену ;
  • «Справедливое распределение цен»: Если игроков выбирают дугу , то цена распределяется равно между ними;
  • Цена для игрока составляет
  • Социальная цена равна сумме цен для игроков: .
Игра на построение сети с ценой анархии

Цена анархии

Цена анархии может составлять . Пример следующей игры на построение сети.

Патологическая цена стабильности игры

В этой игре 2 различных равновесия. Если все разделяют дугу , то социальная цена равна . Более того, это равновесие оптимально. Однако разделение всеми дуги является также равновесием Нэша. Любой агент имеет цену в равновесной стратегии и переключение его на другую дугу повышает его цену до .

Нижняя граница цены стабильности

Здесь приведена патологическая игра с таким же поведением, но уже для цены стабильности. Присутствует игроков, каждый из которых начинает с вершины и пытается соединить её с вершиной . Допустим цены непомеченных дуг равны 0.

Оптимальной стратегией для всех игроков является общее использование дуги , что даёт социальную цену . Однако имеется единственная стратегия с равновесием Нэша для этой игры. В случае оптимальности каждый игрок платит и игрок 1 может уменьшить свою цену путём переключения на дугу . Если это происходит, игроку 2 становится выгодным переключиться на дугу и так далее. В конце концов агенты достигнут равновесия Нэша, оплачивая свою собственную отдельную дугу. Такое распределение имеет социальную цену , где является -ым> гармоническим числом, что равно . Хотя это значение неограниченно, цена стабильности экспоненциально лучше цены анархии в этой игре.

Верхняя граница цены стабильности

По определению игры на построение сети являются играми на переполнение, поэтому они допускают потенциальную функцию .

Теорема. [Теорема 19.13 из книги 1] Предположим, что существует константы и , такие, что для любой стратегии

Тогда цена стабильности меньше

Доказательство. Глобальный минимум функции является равновесием Нэша, так что

Социальная цена была определена как сумма цен по дугам, так что

Тривиально получаем и вычисления выше дают , так что можно привлечь теорему для верхней границы цены стабильности.

См. также

  • Распределение объектов (конкурентная игра) — игра без цены стабильности.

Примечания

    Литература

    1. Vijay V. Vazirani, Noam Nisan, Tim Roughgarden, Éva Tardos. Algorithmic Game Theory. — Cambridge, UK: Cambridge University Press, 2007. — ISBN 0-521-87282-0.
    2. L. Agussurja, H. C. Lau. The Price of Stability in Selfish Scheduling Games // Web Intelligence and Agent Systems: An International Journal. — 2009. Т. 9, вып. 4.
    3. Jian Li. An upper bound on the price of stability for undirected Shapely network design games // Information Processing Letters. — 2009. Т. 109, вып. 15. С. 876—878.
    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.