Теория игр в экономике. Использование теории игр в практике управления

Использование математических методов, к числу которых относится теория игр, в анализе экономических процессов позволяет выявить такие тенденции, взаимосвязи, которые остаются скрытыми при применении других методов.

В экономической действительности на каждом шагу встречаются ситуации, когда отдельные люди, фирмы или целые страны пытаются обойти друг друга в борьбе за первенство. Такими ситуациями и занимается ветвь экономического анализа, называемая "теория игр".

"Теория игр изучает то, каким образом двое или более игроков выбирают отдельные действия или целые стратегии. Название этой теории настраивает на несколько отвлеченный лад, поскольку оно ассоциируется с игрой в шахматы и бридж или с ведением войн. На самом деле выводы этой дисциплины весьма глубоки. Теория игр была разработана выходцем из Венгрии, гениальным математиком Джоном фон Нейманом (1903-1957). Эта теория сравнительно молодая математическая дисциплина.

В дальнейшем теория игр была дополнена такими разработками, как равновесие Нэша (по имени математика Джона Нэша). Равновесие по Нэшу возникает, когда ни один из игроков не может улучшить своего положения, если его противники не изменят своих стратегий. Стратегия каждого игрока является лучшим ответом на стратегию его противника. Иногда равновесие по Нэшу называют также некооперативным равновесием, поскольку участники совершают свой выбор, не вступая ни в какие соглашения друг с другом и не принимая во внимание никаких других соображений (интересы общества или интересы других сторон), кроме собственной выгоды.

Равновесие совершенно конкурентного рынка также является равновесием по Нэшу, или некооперативным равновесием, при котором каждая фирма и каждый потребитель принимают решения исходя из уже существующих цен как не зависящих от его воли. Мы уже знаем, что в условиях, когда каждая фирма стремится максимизировать прибыль, а каждый потребитель - полезность, равновесие возникает, когда цены равны предельным издержкам, а прибыль - нулю. " Мамаева Л.Н. Институциональная экономика: Курс лекций - М.: Издательско-торговая корпорация «Дашков и К», 2012. - 200 с.

Вспомним концепцию "невидимой руки" Адама Смита: "Преследуя собственные интересы, он (индивид) часто в большей степени способствует процветанию общества, чем если бы он к этому сознательно стремился" Смит А. Исследование о природе и причинах богатства народов // Антология экономической классики. - М.: Эконов-ключ, 19931. Парадокс "невидимой руки" заключается в том, что, хотя каждый и действует как самостоятельная сила, в конечном итоге общество остается в выигрыше. При этом конкурентное равновесие является равновесием по Нэшу еще и в том смысле, что ни у кого нет повода изменять свою стратегию, если и все остальные придерживаются своей. В условиях совершенно конкурентной экономики некооперативное поведение является экономически эффективным с точки зрения интересов общества.

Напротив, когда члены некоторой группы решают кооперироваться и совместно прийти к монопольной цене, такое поведение нанесет ущерб экономической эффективности. Государство вынуждено создавать антимонопольное законодательство и тем самым урезонивать тех, кто пытается завысить цены и поделить рынок. Однако не всегда разобщенность в поведении является экономически эффективной. Соперничество между фирмами ведет к низким ценам и конкурентному объему производства. "Невидимая рука" оказывает почти волшебное воздействие на совершенно конкурентные рынки: эффективное распределение ресурсов происходит в результате действий индивидов, стремящихся к максимизации прибыли.

Однако во многих случаях некооперативное поведение приводит к экономической неэффективности или даже представляет угрозу для общества (например, гонка вооружений). Некооперативное поведение как со стороны США, так и со стороны СССР заставляло обе стороны вкладывать огромные средства в военную область и привело к созданию арсенала, состоящего из почти 100000 ядерных боеголовок. Существует также опасение, что чрезмерная доступность оружия в Америке может стать причиной своего рода внутренней гонки вооружений. Одни люди вооружают себя против других - и этот "бег наперегонки" может продолжаться до бесконечности. Здесь в действие вступает вполне "видимая рука", направляющая это разрушительное состязание и не имеющая ничего общего с "невидимой рукой" Адама Смита. Еще один важный экономический пример - "игры в загрязнения" (окружающей среды). Здесь объектом нашего внимания станет такой вид побочных эффектов, как загрязнение. Если бы фирмы никогда и никого не спрашивали о том, как им поступить, любая из них скорее предпочла бы создавать загрязнения, чем устанавливать дорогостоящие очистители. Если же какая-нибудь фирма из благородных побуждений решилась бы уменьшить вредные выбросы, то издержки, а следовательно, и цены на ее продукцию, возросли бы, а спрос упал. Вполне возможно, эта фирма просто обанкротилась бы. Живущие в жестоком мире естественного отбора, фирмы скорее предпочтут оставаться в условиях равновесия по Нэшу Ни одной фирме не удастся повысить прибыль, уменьшая загрязнение.

Вступив в смертоносную экономическую игру, каждая неконтролируемая государством и максимизирующая прибыль сталелитейная фирма будет производить загрязнения воды и воздуха. Если какая-либо фирма попытается очищать свои выбросы, то тем самым она будет вынуждена повысить цены и потерпеть убытки. Некооперативное поведение установит равновесие по Нэшу в условиях высоких выбросов. Правительство может предпринять меры, с тем чтобы равновесие переместилось. В этом положении загрязнение будет незначительным, прибыли же останутся теми же. Мамаева Л.Н. Институциональная экономика: Курс лекций - М.: Издательско-торговая корпорация «Дашков и К», 2012. - 203 с.

Игры в загрязнения - один из случаев того, как механизм действия "невидимой руки" не срабатывает. Это ситуация, когда равновесие по Нэшу неэффективно. Иногда подобные неконтролируемые игры становятся угрожающими, и здесь может вмешаться правительство. Установив систему штрафов и квот на выбросы, правительство может побудить фирмы выбрать исход, соответствующий низкому уровню загрязнения. Фирмы зарабатывают ровно столько же, сколько и прежде, при больших выбросах, мир же становится несколько чище.

Теория игр применима и к макроэкономической политике. Экономисты и политики в США часто поругивают существующую денежно-кредитную и налогово-бюджетную политику: дефицит федерального бюджета слишком велик и уменьшает национальные сбережения, тогда как кредитно-денежная политика порождает такие процентные ставки, которые ограничивают инвестиции. Более того, этот "бюджетно-денежный синдром" является свойством макроэкономического "ландшафта" уже более десяти лет. Почему же Америка так упорно проводит оба вида политики, хотя ни один из них нежелателен?

Можно попытаться объяснить этот синдром с точки зрения теории игр. Стало привычным в современной экономике разделять данные разновидности политики. Центральный банк Америки - Федеральная резервная система - определяет независимо от правительства денежно-кредитную политику, назначая процентные ставки. Налогово-бюджетной политикой, налогами и расходами - заведуют законодательные и исполнительные власти. Однако каждый из этих видов политики имеет разные цели. Центральный банк стремится ограничить рост предложения денег и обеспечить низкие темпы инфляции.

Артур Берне, специалист по экономическим циклам и бывший глава ФРС, писал: "Чиновники центрального банка склонны, в силу традиции, а возможно, и в силу личного склада, держать цены в узде. Их ненависть к инфляции еще более разгорается после общения с единомышленниками из частных финансовых кругов". Власти же, заведующие налогово-бюджетной политикой, больше озабочены такими вопросами, как полная занятость, собственная популярность, сохранение низких налогов и грядущие выборы.

Лица, проводящие налогово-бюджетную политику, предпочитают минимально возможную величину безработицы, увеличение государственных расходов в сочетании с понижением налогов и не заботятся об инфляции и частных инвестициях.

В бюджетно-денежной игре кооперативная стратегия приводит к умеренной инфляции и безработице в сочетании с большим объемом инвестиций, стимулирующим экономический рост. Однако желание уменьшить безработицу и реализовать социальные программы побуждает руководство страны прибегать к увеличению бюджетного дефицита, тогда как неприятие инфляции заставляет центральный банк поднимать процентные ставки. Некооперативное равновесие означает наименьший возможный объем инвестиций.

Они выбирают "большой бюджетный дефицит". С другой стороны, центральный банк пытается уменьшить инфляцию, не подвержен влиянию профсоюзов и лоббирующих группировок и выбирает "высокие процентные ставки". Результатом является некооперативное равновесие с умеренными величинами инфляции и безработицы, но с низким уровнем инвестиций.

Возможно, что именно благодаря "бюджетно-денежной игре" президент Клинтон выдвинул экономическую программу по уменьшению бюджетного дефицита, снижению процентных ставок и расширению объема инвестиций.

Существуют разные способы описания игр. Один из них состоит в том, что рассматриваются все возможные стратегии игроков и определяются платежи, соответствующие любой возможной комбинации стратегий игроков. Игра, описанная таким способом, называется игрой в нормальной форме.

Нормальная форма игры двух участников состоит из двух платежных матриц, показывающих, какую сумму получит каждый из игроков при любой из возможных пар стратегий. Обычно эти матрицы выражают в форме единой матрицы, которую называют биматрицей. Элементами биматрицы являются пары чисел, первое из которых определяет величину выигрыша первого игрока, а второе - величину выигрыша второго. Первый игрок (государство) выбирает одну из m стратегий, при этом каждой стратегии соответствует строка матрицы I (i= 1,…,m). Второй игрок (бизнес) выбирает одну из n стратегий, при этом каждой стратегии соответствует столбец матрицы j (j= 1,…,n). Пара чисел на пересечении строки и столбца, которые соответствуют стратегиям, выбранным игроками, показывает величину выигрыша каждого из них. В общем случае, если игрок I выбирает стратегию i а игрок II - стратегию j, то выигрыши первого и второго игроков соответственно равны и (i= 1,…,m; j= 1,…,n), где m,n - число конечных стратегий соответственно игроков I и II. Предполагается, что каждому из игроков известны все элементы биматрицы выигрышей. В этом случае их стратегия называется определенной и имеет конечное число вариантов.

Если игроку неизвестны какие-либо варианты стратегий противника (элементы матрицы), то игра называется неопределенной и может иметь бесконечное число вариантов (стратегий).

Существуют и другие классы игр, где игроки выигрывают и проигрывают одновременно.

Антагонистические игры двух лиц связаны с тем, что один из игроков выигрывает ровно столько, сколько проигрывает другой. В таких играх интересы ее игроков прямо противоположны друг другу.

В качестве примера рассмотрим игру, в которой участвуют два игрока, каждый из них имеет по две стратегии. Выигрыши каждого из игроков определяются такими правилами: если оба игрока выбирают стратегии с одинаковыми номерами (игрок I - , игрок II -), то первый игрок выигрывает, а второй проигрывает (государство повышает налоги - бизнес платит их, т.е. выигрыш государства определяет проигрыш бизнеса); если оба игрока выбирают разные стратегии (игрок I - і 1 игрок II - j 2 то первый проигрывает, а второй выигрывает (государство повышает налоги на бизнес - бизнес уклоняется от них; проигрыш государства - выигрыш бизнеса).

Теория игр есть теория математических моделей таких явлений, в которых участники ("игроки") имеют различные интересы и располагают для достижения своих целей более или менее свободно выбираемыми путями (стратегиями). В большинстве работ по теории игр предполагается, что интересы участников игры поддаются количественному измерению и являются вещественными функциями ситуаций, т.е. набором стратегий, получаемых при выборе каждым из игроков некоторой своей стратегии. Для получения результатов необходимо рассматривать те или иные классы игр, выделенные некоторыми ограничительными предположениями. Такие ограничения можно накладывать несколькими путями.

Можно выделить несколько способов (путей) наложения ограничений.

1. Ограничения возможностей взаимоотношений игроков между собой. Простейшим случаем является такой, когда игроки действуют совершенно разобщено и не могут сознательно помогать или мешать друг другу действием или бездействием, информацией или дезинформацией. Такое положение дел неизбежно наступает, когда в игре участвуют только два игрока (государство и бизнес), имеющие диаметрально противоположные интересы: увеличение выигрыша одного из них означает уменьшение выигрыша другого, и притом на ту же сумму, при условии, что выигрыши обоих игроков выражаются в одинаковых единицах измерения. Не нарушая общности, можно принять суммарный выигрыш обоих игроков равным нулю и трактовать выигрыш одного из них как проигрыш другого.

Эти игры называют антагонистическими (или играми с нулевой суммой, или нулевыми играми двух лиц). Они предполагают, что никаких взаимоотношений между игроками, никаких компромиссов, обменов информацией и другими ресурсами не может быть по самой своей природе вещей, по сути игры, поскольку каждое сообщение, получаемое игроком о намерениях другого, может лишь увеличить выигрыш первого игрока и тем самым увеличить проигрыш его противника.

Таким образом, сделаем вывод, что в антагонистических играх игрокам можно не иметь непосредственных взаимоотношений и вместе с тем находиться в состоянии игры (противостоянии) по отношению друг к другу.

2. Ограничения или упрощающие предположения на множестве стратегий игроков. В наиболее простом случае эти множества стратегий конечны, что устраняет ситуации, связанные с возможными совпадениями (сходимостями) в множествах стратегий, избавляет от необходимости вводить на множествах какую-либо технологию.

Игры, в которых множества стратегий каждого из игроков конечны, называются конечными играми.

3. Предложения о внутреннем строении каждой стратегии, т.е. о ее содержании. Так, например, в качестве стратегий можно рассматривать функции времени (непрерывного или дискретного), значениями которых являются действия игрока в соответствующий момент. Эти и подобные им игры принято называть динамическими (позиционными).

Ограничениями стратегий игроков могут быть и их целевые функции, т.е. определение тех целей, на реализацию которых направлена та или иная стратегия. Можно предположить, что ограничения на стратегию связаны и со способами достижения этих целей в тех или иных временных интервалах, например стремление бизнеса добиться снижения размеров обязательных продаж валютной выручки в течение ближайших трех месяцев (или одного года). Если же предположений о природе стратегий не делается, то они считаются некоторым абстрактным множеством. Такого рода игры в самой простой постановке вопроса называются играми в нормальной форме.

Конечные антагонистические игры в нормальной форме называются матричными. Это название объясняется возможностью следующей интерпретации игр такого типа. Будем понимать стратегии первого игрока (игрок I - государство) как строки некоторой матрицы, а стратегии второго игрока (игрок II - бизнес) - как ее столбцы. Для краткости стратегиями игроков называют не сами строки или столбцы матрицы, а их номера. Тогда ситуациями игры оказываются клетки этой матрицы, стоящие на пересечениях каждой строки с каждым из столбцов. Заполнив эти клетки-ситуации числами, описывающими выигрыши игрока I в этих ситуациях, мы завершим задание игры. Полученная матрица называется матрицей выигрыша игры, или матрицей игры. Ввиду антагонистичности матричной игры выигрыш игрока II в каждой ситуации вполне определяется выигрышем игрока I в этой ситуации, отличаясь от него только знаком. Поэтому дополнительных указаний о функции выигрыша игрока II в матричной игре не требуется.

Матрицу, имеющую m строк и n столбцов, называют (m*n) - матрицей, а игру с этой матрицей - (m*n) - игрой.

Процесс (m*n) - игры с матрицей можно представить следующим образом:

Игрок I фиксирует номер строки i, а игрок II - номер столбца j, после чего первый игрок получает от своего противника сумму

Целью игрока I в матричной игре является получение максимального выигрыша, цель игрока II состоит в том, чтобы дать игроку I минимальный выигрыш.

Пусть игрок I (государство) выбирает некоторую свою стратегию i. Тогда в наихудшем случае он получит выигрыш min . В теории игр игроки предполагаются осторожными, рассчитывающими на наименее благоприятный для себя поворот событий.

Такое наименее благоприятное для игрока I положение дел может наступить, например, в том случае, когда стратегия i станет известной игроку II (бизнес). Предвидя такую возможность, игрок I должен выбирать свою стратегию так, чтобы максимизировать этот минимальный выигрыш:

min = max min (I)

Значение, стоящее в правой части равенства, является гарантированным выигрышем игрока I. Игрок II (бизнес) должен выбрать такую стратегию, что

max = min max (II)

Значение, стоящее в правой части равенства, является выигрышем игрока I, больше которого он при правильных действиях противника получить не может.

Фактический выигрыш игрока I должен при разумных действиях партнеров находиться в интервале между значениями выигрыша в первом и втором случаях. Если эти значения равны, то выигрыш игрока I является вполне определенным числом, сами игры называются вполне определенными. Выигрыш игрока I называется значением игры, и он равен элементу матрицы.

У игроков могут быть дополнительные возможности - выбор своих стратегий случайно и независимо друг от друга (стратегии соответствуют строкам и столбцам матрицы). Случайный выбор игроком своих стратегий называется смешанной стра тегии этого игрока. В (m*n) - игрё смешанные стратегии игрока I определяются наборами вероятностей: X = (,…), с которыми этот игрок выбирает свои первоначальные, чистые стратегии.

В основе теории матричных игр лежит теорема Неймана активных стратегиях: "Если один из игроков придерживается своей оптимальной стратегии, то выигрыш остается неизменным и равным цене игры независимо от того, что делает другой игрок, если он не выходит за пределы своих активных стратегий (т.е. пользуется любой из них в чистом виде или смешивает их в любых пропорциях" Neumann J. Contributions to the theory of games. 1995.. - 155 с.). Отметим, что активной называется чистая стратегия игрока, входящая в его оптимальную смешанную стратегию с отличной от нуля вероятностью.

Главная цель игры - нахождение оптимальной стратегии для обоих игроков, если не с максимальным выигрышем одного из них, то тогда с минимальным проигрышем для обоих. Метод нахождения оптимальных стратегий дает часто больше, чем это необходимо для практических целей. В матричной игре не обязательно, чтобы игрок знал все свои оптимальные структуры, поскольку они все взаимозаменяемы и игроку для успешной игры, достаточно знать одну из них. Поэтому применительно к матричным играм актуальным является вопрос о нахождении хотя бы одной оптимальной стратегии для каждого из игроков.

Основная теорема о матричных играх устанавливает существование значения игры и оптимальных смешанных стратегий для обоих игроков. Оптимальная стратегия не обязана быть единичной. Это очень важный вывод, полученный на основе теории игр.

Для играющего в матричную игру субъекта характерны следующие качества:

элементы матрицы интерпретируются как денежные платежи и соответственно их выигрыш и проигрыш оцениваются в денежной форме;

каждый из игроков применяет к этим элементам функцию полезности;

в игре каждый игрок действует так, как если бы функция полезности его оппонента оказывала на матрицу точно такое же воздействие, т.е. каждый смотрит на игру "со своей колокольни".

Эти предположения приводят к играм с нулевой суммой, в которых возникают отношения кооперирования, торгов и другого типа взаимодействий между игроками как до начала игры, так и в ее процессе. Мамаева Л.Н. Институциональная экономика: Курс лекций - М.: Издательско-торговая корпорация «Дашков и К», 2012. - 210 - 211с.

Обобщение теории игр, имеющее целью включение в нее других возможностей анализа, приводит к интересным, но достаточно трудным задачам. При развитии теории игр необходимо применять функцию полезности не только к денежным исходам, но и к суммам с ожидаемыми будущими исходами. Эти предположения являются спорными, но они существуют. В данном случае мы исходим из того, что это предположение о подобной операции имеет сходство с поведением игроков в определенных ситуациях принятия решений и допускает возможность, что способ ведения игры данным игроком зависит от состояния его капитала во время ведения им игры.

Рассмотрим это на следующем примере. Пусть первый игрок к моменту начала игры G обладает капиталом в x долларов. Тогда его капитал в конце игры будет равен + x, где - получаемый им от игры фактический выигрыш. Полезность, которую он приписывает такому исходу, равна f (+ х), где f - функция полезности.

Эти несколько примеров иллюстрируют только часть огромного разнообразия результатов, которые можно получить, используя теорию игр. Данный раздел экономической теории является чрезвычайно полезным (для экономистов и других представителей общественных наук) инструментом анализа ситуаций, при которых небольшое число людей хорошо информировано и пытается перехитрить друг друга на рынках, в сфере политики или в военных действиях.

Из популярного американского блога Cracked.

Теория игр занимается тем, что изучает способы сделать лучший ход и в результате получить как можно больший кусок выигрышного пирога, оттяпав часть его у других игроков. Она учит подвергать анализу множество факторов и делать логически взвешенные выводы. Я считаю, её нужно изучать после цифр и до алфавита. Просто потому что слишком многие люди принимают важные решения, основываясь на интуиции, тайных пророчествах, расположении звёзд и других подобных. Я тщательно изучил теорию игр, и теперь хочу рассказать вам о её основах. Возможно, это добавит здравого смысла в вашу жизнь.

1. Дилемма заключенного

Берто и Роберт были арестованы за ограбление банка, не сумев правильно использовать для побега угнанный автомобиль. Полиция не может доказать, что именно они ограбили банк, но поймала их с поличным в украденном автомобиле. Их развели по разным комнатам и каждому предложили сделку: сдать сообщника и отправить его за решетку на 10 лет, а самому выйти на свободу. Но если они оба сдадут друг друга, то каждый получит по 7 лет. Если же никто ничего не скажет, то оба сядут на 2 года только за угон автомобиля.

Получается, что, если Берто молчит, но Роберт сдает его, Берто садится в тюрьму на 10 лет, а Роберт выходит на свободу.

Каждый заключенный - игрок, и выгода каждого может быть представлена в виде «формулы» (что получат они оба, что получит другой). Например, если я ударю тебя, моя выигрышная схема будет выглядеть так (я получаю грубую победу, ты страдаешь от сильной боли). Поскольку у каждого заключенного есть два варианта, мы можем представить результаты в таблице.

Практическое применение: Выявление социопатов

Здесь мы видим основное применение теории игр: выявление социопатов, думающих лишь о себе. Настоящая теория игр - это мощный аналитический инструмент, а дилетантство часто служит красным флагом, с головой выдающим человека, лишенного понятия чести. Люди, делающие расчеты интуитивно, считают, что лучше поступить некрасиво, потому что это приведет к более короткому тюремному сроку независимо от того, как поступит другой игрок. Технически это правильно, но только если вы недальновидный человек, ставящий цифры выше человеческих жизней. Именно поэтому теория игра так популярна в сфере финансов.

Настоящая проблема дилеммы заключенного в том, что она игнорирует данные. Например, в ней не рассматривается возможность вашей встречи с друзьями, родственниками, или даже кредиторами человека, которого вы посадили в тюрьму на 10 лет.

Хуже всего то, что все участники дилеммы заключенного действуют так, как будто никогда не слышали ней.

А лучший ход - хранить молчание, и через два года вместе с хорошим другом пользоваться общими деньгами.

2. Доминирующая стратегия

Это ситуация, при которой ваши действия дают наибольший выигрыш, независимо от действий оппонента. Что бы ни происходило - вы всё сделали правильно. Вот почему многие люди при «дилемме заключенного» считают: предательство приводит к «наилучшему» результату независимо от того, что делает другой человек, а игнорирование действительности, свойственное этому методу, заставляет всё выглядеть супер-просто.

Большинство игр, в которые мы играем, не имеет строго доминирующих стратегий, потому что иначе они были бы просто ужасны. Представьте, что вы всегда делали бы одно и то же. В игре «камень-ножницы-бумага» нет никакой доминирующей стратегии. Но если бы вы играли с человеком, у которого на руках надеты прихватки, и он мог показать только камень или бумагу, у вас была бы доминирующая стратегия: бумага. Ваша бумага обернет его камень или приведет к ничьей, и вы не сможете проиграть, потому что соперник не может показать ножницы. Теперь, когда у вас есть доминирующая стратегия, нужно быть дураком, чтобы попробовать что-нибудь другое.

3. Битва полов

Игры интереснее, когда у них нет строго доминирующей стратегии. Например, битва полов. Анджали и Борислав идут на свидание, но не могут выбрать между балетом и боксом. Анджали любит бокс, потому что ей нравится, когда льется кровь на радость орущей толпе зрителей, считающих себя цивилизованными только потому, что они заплатили за чьи-то разбитые головы.

Борислав хочет смотреть балет, потому что он понимает, что балерины проходят через огромное количество травм и сложнейших тренировок, зная, что одна травма может положить конец всему. Артисты балета - величайшие спортсмены на Земле. Балерина может ударить вас ногой в голову, но никогда этого не сделает, потому что ее нога стоит гораздо дороже вашего лица.

Каждый из них хочет пойти на своё любимое мероприятие, но они не хотят наслаждаться им в одиночестве, таким образом, получаем схему их выигрыша: наибольшее значение - делать то, что им нравится, наименьшее значение - просто быть с другим человеком, и ноль - быть в одиночестве.

Некоторые люди предлагают упрямо балансировать на грани войны: если вы, несмотря ни на что, делаете то, что хотите, другой человек должен подстроиться под ваш выбор или потерять все. Как я уже говорил, упрощённая теория игр отлично выявляет глупцов.

Практическое применение: Избегайте острых углов

Конечно, и у этой стратегии есть свои значительные недостатки. Прежде всего, если вы относитесь к вашим свиданиям как к «битве полов», она не сработает. Расстаньтесь, чтобы каждый из вас мог найти человека, который ему понравится. А вторая проблема заключается в том, что в этой ситуации участники настолько не уверены в себе, что не могут этого сделать.

По-настоящему выигрышная стратегия для каждого - делать то, что они хотят, а после, или на следующий день, когда они будут свободны, пойти вместе в кафе. Или же чередовать бокс и балет, пока в мире развлечений не произойдет революция и не будет изобретен боксерский балет.

4. Равновесие Нэша

Равновесие Нэша - это набор ходов, где никто не хочет сделать что-то по-другому после свершившегося факта. И если мы сможем заставить это работать, теория игр заменит всю философскую, религиозную, и финансовую систему на планете, потому что «желание не прогореть» стало для человечества более мощной движущей силой, чем огонь.

Давайте быстро поделим 100$. Вы и я решаем, сколько из сотни мы требуем и одновременно озвучиваем суммы. Если наша общая сумма меньше ста, каждый получает то, что хотел. Если общее количество больше ста, тот, кто попросил наименьшее количество, получает желаемую сумму, а более жадный человек получает то, что осталось. Если мы просим одинаковую сумму, каждый получает 50 $. Сколько вы попросите? Как вы разделите деньги? Существует единственный выигрышный ход.

Требование 51 $ даст вам максимальную сумму независимо от того, что выберет ваш противник. Если он попросит больше, вы получите 51 $. Если он попросит 50 $ или 51 $, вы получите 50 $. И если он попросит меньше 50 $, вы получите 51 $. В любом случае нет никакого другого варианта, который принесет вам больше денег, чем этот. Равновесие Нэша - ситуация, в которой мы оба выбираем 51 $.

Практическое применение: сначала думайте

В этом вся суть теории игр. Не обязательно выиграть и тем более навредить другим игрокам, но обязательно сделать лучший для себя ход, независимо от того, что подготовят для вас окружающие. И даже лучше, если этот ход будет выгоден и для других игроков. Это своего рода математика, которая могла бы изменить общество.

Интересный вариант этой идеи - распитие спиртного, которое можно назвать Равновесием Нэша с временной зависимостью. Когда вы достаточно много пьете, то не заботитесь о поступках других людей независимо от того, что они делают, но на следующий день вы очень жалеете, что не поступили иначе.

5. Игра в орлянку

В орлянке участвуют Игрок 1 и Игрок 2. Каждый игрок одновременно выбирает орла или решку. Если они угадывают, Игрок 1 получает пенс Игрока 2. Если же нет - Игрок 2 получает монету Игрока 1.

Выигрышная матрица проста…

…оптимальная стратегия: играйте полностью наугад. Это сложнее, чем вы думаете, потому что выбор должен быть абсолютно случайным. Если у вас есть предпочтения орла или решки, противник может использовать его, чтобы забрать ваши деньги.

Конечно, настоящая проблема здесь заключается в том, что было бы намного лучше, если бы они просто бросали один пенс друг в друга. В результате их прибыль была бы такой же, а полученная травма могла бы помочь этим несчастным людям почувствовать что-то, кроме ужасной скуки. Ведь это худшая игра из существующих когда-либо. И это идеальная модель для серии пенальти.

Практическое применение: Пенальти

В футболе, хоккее и многих других играх, дополнительное время - это серия пенальти. И они были бы интереснее, если бы строились на том, сколько раз игроки в полной форме смогут сделать «колесо», потому что это, по крайней мере, было бы показателем их физических способностей и на это было бы забавно посмотреть. Вратари не могут чётко определить движение мяча или шайбы в самом начале их движения, потому что, к огромному сожалению, в наших спортивных состязаниях роботы все еще не участвуют. Вратарь должен выбрать левое или правое направление и надеяться, что его выбор совпадет с выбором противника, бьющего по воротам. В этом есть что-то общее с игрой в монетку.

Однако обратите внимание, что это не идеальный пример сходства с игрой в орла и решку, потому что даже при правильном выборе направления вратарь может не поймать мяч, а нападающий может не попасть по воротам.

Итак, каково же наше заключение согласно теории игр? Игры с мячом должны заканчиваться способом «мультимяча», где каждую минуту игрокам один на один выводится дополнительный мяч/шайба, до получения одной из сторон определенного результата, который был показателем настоящего мастерства игроков, а не эффектным случайным совпадением.

В конце концов, теория игр должна использоваться для того, чтобы сделать игру умнее. А значит лучше.

Теория игр - теория математических моделей принятия оптимальных решений в условиях конфликта. Поскольку стороны, участвующие в большинстве конфликтов, заинтересованы в том, чтобы скрыть от противника свои намерения, принятия решений в условиях конфликта, как правило, происходит в условиях неопределенности. Наоборот, фактор неопределенности можно интерпретировать как противника субъекта, принимающего решение (тем самым принятие решений в условиях неопределенности можно понимать как принятие решений в условиях конфликта). В частности, многие утверждения математической статистики естественным образом формулируются как теоретико-игровые.

Теория игр - раздел прикладной математики, который используется в социальных науках (всего в экономике), биологии, политических науках, компьютерных науках (главным образом для искусственного интеллекта) и философии. Теория игр пытается математически зафиксировать поведение в стратегических ситуациях , в которых успех субъекта, делающего выбор зависит от выбора других участников. Если сначала развивался анализ игры, в которых один из противников выигрывает за счет других (игры с нулевой суммой), то впоследствии начали рассматривать широкий класс взаимодействий, которые были классифицированы по определенным критериям. На сегодняшний день «теория игр то вроде зонтика или универсальной теории для рациональной стороны социальных наук, где социальные можем понимать широко, включая как человеческих так не-человеческих игроков (компьютеры, животные, растения)» (Роберт Ауманн, 1987)

Эта отрасль математики получила определенное отражение в массовой культуре. В 1998 году американская писательница и журналисткаСильвия Назар опубликовала книгу о жизни Джона Нэша, нобелевского лауреата по экономике за достижения в теории игр, а в 2001 по мотивам книги снят фильм «Игры разума». (Таким образом, теория игр - одна из немногих отраслей математики в которой можно получить Нобелевскую премию). Некоторые американские телевизионные шоу, например, Friend or Foe , Alias или NUMBERS периодически используют в своих выпусках теорию игр.

Джон Нэш - математик,нобелевский лауреат известен широкой общественности благодаря фильму Игры разума.

Понятие теории игр

Логической основой теории игр является формализация трех понятий, входящих в ее определение и являются фундаментальными для всей теории:

Конфликт,
Принятие решения в конфликте,
Оптимальность принятого решения.

Эти понятия рассматриваются в теории игр в самом широком смысле. Их формализации отвечают содержательным представлением о соответствующих объектах.

Если назвать участников конфликта коалициями действия (обозначив их множество как D, возможные действия каждой из коалиции действия - ее стратегиями (множество всех стратегий коалиции действия K обозначается как S ), результаты конфликта - ситуациями (множество всех ситуаций обозначается как S ; считается, что каждая ситуация складывается вследствие выбора каждой из коалиций действия некоторой своей стратегии, так, что ), заинтересованные стороны - коалициями интересов (их множество - I) и, наконец, говорить о возможных преимуществах для каждой коалиции интересов K одной ситуации s " перед другим s "(этот факт обозначается как ), то конфликт в целом может быть описан как система

Такая система, представляющая конфликт, называется игрой . Конкретизации составляющих, задающих игру, приводят к различным классам игр.

Классификация игр

Отдельными классами бескоалиционный игр есть:

антагонистические игры, включая матричные игры и игры на единичном квадрате.
динамичные игры, в том числе дифференциальные игры,
рекурсивные игры,
игры на выживание

и другие, также относятся к бескоалиционный игр.

Математический аппарат

Теория игр широко использует различные математические методы и результаты теории вероятностей, классического анализа, функционального анализа (особенно важны теоремы о неподвижные точки), комбинаторной топологии, теории дифференциальных и интегральных уравнений, и другие. Специфика теории игр способствует разработке разнообразных математических направлений (например, теория выпуклых множеств, линейное программирование, и т.д.).

Принятием решения в теории игр считается выбор коалицией действия, или, в частности, выбор игроком некоторой своей стратегии. Этот выбор можно представить себе в виде одноразового действия и возводить формально к выбору элемента из множества. Игры с таким пониманием выбора стратегий называются играми в нормальной форме . Им противопоставляются динамичные игры, в которых выбор стратегии является процессом, который происходит в течение некоторого времени, которое сопровождается расширением и сужением возможностей, получением и потерей информации о текущем состоянии дел, и т.п.. Формально, стратегией в такой игре есть функция, определенная на множестве всех информационных состояний субъекта, принимающего решения. Некритическое использование «свободы выбора» стратегий может приводить к парадоксальным явлениям.

Оптимальность и развязки

Вопрос о формализации понятия оптимальности является весьма сложным. Единое представление об оптимальности в теории игр отсутствует, поэтому приходится рассматривать несколько принципов оптимальности. Область возможности применения каждого из принципов оптимальности, используемых в теории игр, ограничивается сравнительно узкими классами игры, или же касается ограниченных аспектов их рассмотрения.

В основе каждого из этих принципов лежат некоторые интуитивные представления о оптимум, как о чем-то «устойчивое», или «справедливое». Формализация этих представлений дает требованиях, предъявляемых к оптимуму и имеющих характер аксиом.

Среди этих требований могут оказаться такие, которые противоречат друг другу (например, можно показать конфликты, в которых стороны вынуждены довольствоваться малыми выигрышами, поскольку крупных выигрышей можно достичь только в условиях неопределенных ситуаций); поэтому в теории игр не может быть сформулирован единый принцип оптимальности.

Ситуации (или множества ситуаций), которые удовлетворяют в некоторой игре те или иные требования оптимальности, называются решениями этой игры. Так как представление об оптимальности не однозначны, имело развязки игр в разных смыслах. Создание определений решений игры, доведение их существования и разработка путей их фактического поиска - три основные вопросы современной теории игр. Близкими к ним есть вопросы о единственности решений игр, о существовании в тех или иных классах игр решений, которые имеют некоторые заранее определенные свойства.

История

Как математическая дисциплина, теория игр зародилась одновременно с теорией вероятностей в 17 веке, но в течение почти 300 лет почти не развивалась. Первой существенной работой по теории игр следует считать статью Дж. фон Неймана «К теории стратегических игр» (1928), а с выходом в свет монографии американских математиков Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение» (1944), теория игр сформировалась как самостоятельная математическая дисциплина. В отличие от других отраслей математики, имеющих преимущественно физическое, или физико-технологическое происхождение, теория игр с самого начала своего развития была направлена на решение задач, возникающих в экономике (а именно в конкурентной экономике).

В дальнейшем, идеи, методы и результаты теории игр стали применять в других областях знаний, имеющих дело с конфликтами: в военном деле, в вопросах морали, при изучении массового поведения индивидов, имеющих различные интересы (например, в вопросах миграции населения, или при рассмотрении биологической борьбы за существование). Теоретико-игровые методы принятия оптимальных решений в условиях неопределенности могут иметь широкое применение в медицине, в экономическом и социальном планировании и прогнозировании, в ряде вопросов науки и техники. Иногда теорию игр относят к математическому аппарату кибернетики, или теории исследования операций.

Возникшая в сороковых годах XX века математическая теория игр чаще всего применяется именно в экономике. Но как с помощью концепции игр смоделировать поведение людей в обществе? Зачем экономисты изучают, в какой угол чаще бьют пенальти футболисты, и как выиграть в «Камень, ножницы, бумагу» в своей лекции рассказал старший преподаватель кафедры микроэкономического анализа ВШЭ Данил Федоровых.

Джон Нэш и блондинка в баре

Игра - это любая ситуация, в которой прибыль агента зависит не только от его собственных действий, но и от поведения остальных участников. Если вы раскладываете дома пасьянс, с точки зрения экономиста и теории игр, это не игра. Она подразумевает обязательное наличие столкновения интересов.

В фильме «Игры разума» о Джоне Нэше, нобелевском лауреате по экономике, есть сцена с блондинкой в баре. В ней показана идея, за которую ученый и получил премию, - это идея равновесия по Нэшу, которое он сам называл управляющей динамикой.

Игра - любая ситуация, в которой выигрыши агентов зависят друг от друга.

Стратегия - описание действий игрока во всех возможных ситуациях.

Исход - комбинация выбранных стратегий.

Итак, с точки зрения теории, игроками в этой ситуации являются только мужчины, то есть те, кто принимает решение. Их предпочтения просты: блондинка лучше брюнетки, а брюнетка лучше, чем ничего. Действовать можно двумя способами: пойти к блондинке или к «своей» брюнетке. Игра состоит из единственного хода, решения принимаются одновременно (то есть нельзя посмотреть, куда пошли остальные, и после походить самому). Если какая-то девушка отвергает мужчину, игра заканчивается: невозможно вернуться к ней или выбрать другую.

Каков вероятный финал этой игровой ситуации? То есть какова ее устойчивая конфигурация, из которой все поймут, что сделали лучший выбор? Во-первых, как правильно замечает Нэш, если все пойдут к блондинке, ничем хорошим это не кончится. Поэтому дальше ученый предполагает, что всем нужно пойти к брюнеткам. Но тогда, если известно, что все пойдут к брюнеткам, ему следует идти к блондинке, ведь она лучше.

В этом и заключается настоящее равновесие - исход, в котором один идет к блондинке, а остальные - к брюнеткам. Может показаться, что это несправедливо. Но в ситуации равновесия никто не может пожалеть о своем выборе: те, кто пойдут к брюнеткам, понимают, что от блондинки они все равно ничего б не получили. Таким образом, равновесие по Нэшу - это конфигурация, при которой никто по отдельности не хочет менять выбранную всеми стратегию. То есть, рефлексируя в конце игры, каждый участник понимает, что даже зная, как походят другие, он сделал бы то же самое. По-другому можно назвать это исходом, где каждый участник оптимальным образом отвечает на действия остальных.

«Камень, ножницы, бумага»

Рассмотрим другие игры на предмет равновесия. Например, в «Камне, ножницах, бумаге» нет равновесия по Нэшу: во всех ее вероятных исходах нет варианта, в котором оба участника были бы довольны своим выбором. Тем не менее, существует Чемпионат мира и World Rock Paper Scissors Society, собирающее игровую статистику. Очевидно, что вы можете повысить свои шансы на победу, если будете что-то знать об обычном поведении людей в этой игре.

Чистая стратегия в игре - это такая стратегия, при которой человек всегда играет одинаково, выбирая одни и те же ходы.

По данным World RPS Society, камень является самым часто выбираемым ходом (37,8%). Бумагу ставят 32,6%, ножницы - 29,6%. Теперь вы знаете, что нужно выбирать бумагу. Однако, если вы играете с тем, кто тоже это знает, вам уже не надо выбирать бумагу, потому что от вас ожидается то же самое. Есть знаменитый случай: в 2005 году два аукционных дома Sotheby“s и Christie”s решали, кому достанется очень крупный лот - коллекция Пикассо и Ван Гога со стартовой ценой в 20 миллионов долларов. Собственник предложил им сыграть в «Камень, ножницы, бумагу», и представители домов отправили ему свои варианты по электронной почте. Sotheby“s, как они позже рассказали, особо не задумываясь, выбрали бумагу. Выиграл Christie”s. Принимая решение, они обратились к эксперту - 11-летней дочери одного из топ-менеджеров. Она сказала: «Камень кажется самым сильным, поэтому большинство людей его выбирают. Но если мы играем не с совсем глупым новичком, он камень не выбросит, будет ожидать, что это сделаем мы, и сам выбросит бумагу. Но мы будем думать на ход вперед, и выбросим ножницы».

Таким образом, вы можете думать на ход вперед, но это не обязательно приведет вас к победе, ведь вы можете не знать о компетенции вашего соперника. Поэтому иногда вместо чистых стратегий правильнее выбирать смешанные, то есть принимать решения случайно. Так, в «Камне, ножницах, бумаге» равновесие, которое мы до этого не нашли, находится как раз в смешанных стратегиях: выбирать каждый из трех вариантов хода с вероятностью в одну третью. Если вы будете выбирать камень чаще, соперник скорректирует свой выбор. Зная это, вы скорректируете свой, и равновесия не выйдет. Но никто из вас не начнет менять поведение, если каждый просто будет выбирать камень, ножницы или бумагу с одинаковой вероятностью. Все потому что в смешанных стратегиях по предыдущим действиям невозможно предугадать ваш следующий ход.

Смешанные стратегии и спорт

Более серьезных примеров смешанных стратегий очень много. Например, куда подавать в теннисе или бить/принимать пенальти в футболе. Если вы ничего не знаете о вашем сопернике или просто постоянно играете против разных, лучшей стратегией будет поступать более-менее случайно. Профессор Лондонской школы экономики Игнасио Паласиос-Уэрта в 2003 году опубликовал в American Economic Review работу, суть которой заключалась в поиске равновесия по Нэшу в смешанных стратегиях. Предметом исследования Паласиос-Уэрта выбрал футбол и в связи с этим просмотрел более 1400 ударов пенальти. Разумеется, в спорте все устроено хитрее, чем в «Камне, ножницах, бумаге»: там учитывается сильная нога спортсмена, попадания в разные углы при ударе со всей силы и тому подобное. Равновесие по Нэшу здесь заключается в расчете вариантов, то есть, к примеру, определении углов ворот, в которые надо бить, чтобы выиграть с большей вероятностью, зная свои слабые и сильные стороны. Статистика по каждому футболисту и найденное в ней равновесие в смешанных стратегиях, показало, что футболисты поступают примерно так, как предсказывают экономисты. Вряд ли стоит утверждать, что люди, которые бьют пенальти, читали учебники по теории игр и занимались довольно непростой математикой. Скорее всего, есть разные способы научиться оптимально себя вести: можно быть гениальным футболистом, и чувствовать, что делать, а можно - экономистом, и искать равновесие в смешанных стратегиях.

В 2008 году профессор Игнасио Паласиос-Уэрта познакомился с Авраамом Грантом, тренером «Челси», который играл тогда в финале Лиги чемпионов в Москве. Ученый написал записку тренеру с рекомендациями по серии пенальти, которые касались поведения вратаря соперника - Эдвина ван дер Сара из «Манчестер Юнайтед». Например, по статистике, он почти всегда отбивал удары на среднем уровне и чаще бросался в естественную для пробивающего пенальти сторону. Как мы определили выше, правильнее все-таки рандомизировать свое поведение с учетом знаний о сопернике. Когда счет по пенальти был уже 6:5, Николя Анелька, нападающий «Челси», должен был забивать. Показывая перед ударом в правый угол, ван дер Сар будто спросил у Анелька, не собирается ли он бить туда.

Суть в том, что все предыдущие удары «Челси» были нанесены именно в правый от пробивающего угол. Мы не знаем точно почему, может быть, из-за консультации экономиста бить в неестественную для них сторону, ведь по статистике к этому менее готов ван дер Сар. Большинство футболистов «Челси» были правшами: ударяя в неестественный для себя правый угол, все они, кроме Терри, забивали. Видимо, стратегия была в том, чтобы Анелька пробил туда же. Но ван дер Сар, похоже, это понял. Он поступил гениально: показал в левый угол дескать «туда собрался бить?», от чего Анелька, наверное, пришел в ужас, ведь его разгадали. В последний момент он принял решение действовать по-другому, ударил в естественную для себя сторону, что и было нужно ван дер Сару, который взял этот удар и обеспечил «Манчестеру» победу. Эта ситуация учит случайному выбору, ведь в ином случае ваше решение может быть просчитано, и вы проиграете.

«Дилемма заключенного»

Наверное, самая известная игра, с которой начинаются университетские курсы о теории игр, - это «Дилемма заключенного». По легенде двух подозреваемых в серьезном преступлении поймали и заперли в разные камеры. Есть доказательство, что они хранили оружие, и это позволяет посадить их на какой-то небольшой срок. Однако доказательств, что они совершили это страшное преступление, нет. Каждому по отдельности следователь рассказывает об условиях игры. Если оба преступника сознаются, оба же сядут на три года. Если сознается один, а подельник будет молчать, сознавшийся выйдет сразу, а второго посадят на пять лет. Если, наоборот, первый не сознается, а второй его сдаст, первый сядет на пять лет, а второй выйдет сразу. Если же не сознается никто, оба сядут на год за хранение оружия.

Равновесие по Нэшу здесь заключается в первой комбинации, когда оба подозреваемых не молчат и оба садятся на три года. Рассуждения каждого таковы: «если я буду говорить, я сяду на три года, если молчать - на пять лет. Если второй будет молчать, мне тоже лучше говорить: не сесть лучше, чем сесть на год». Это доминирующая стратегия: говорить выгодно, независимо от того, что делает другой. Однако в ней есть проблема - наличие варианта получше, ведь сесть на три года хуже, чем сесть на год (если рассматривать историю только с точки зрения участников и не учитывать вопросы морали). Но сесть на год невозможно, ведь, как мы поняли выше, молчать обоим преступникам невыгодно.

Улучшение по Парето

Есть известная метафора про невидимую руку рынка, принадлежащая Адаму Смиту. Он говорил, что если мясник будет сам для себя стараться заработать деньги, от этого будет лучше всем: он сделает вкусное мясо, которое купит булочник на деньги от продажи булок, которые он, в свою очередь, тоже должен будет делать вкусными, чтобы они продавались. Но оказывается, эта невидимая рука не всегда работает, и таких ситуаций, когда каждый действует за себя, а всем плохо, очень много.

Поэтому иногда экономисты и специалисты по теории игр думают не об оптимальном поведении каждого игрока, то есть не о равновесии по Нэшу, а об исходе, при котором будет лучше всему обществу (в «Дилемме» общество состоит из двух преступников). С этой точки зрения, исход эффективен, когда в нем нет улучшения по Парето, то есть невозможно сделать кому-то лучше, не сделав при этом хуже другим. Если люди просто меняются товарами и услугами, это Парето-улучшение: они делают это добровольно, и вряд ли кому-то от этого плохо. Но иногда, если просто дать людям взаимодействовать и даже не вмешиваться, то, к чему они придут, не будет оптимальным по Парето. Это и происходит в «Дилемме заключенного». В ней, если мы даем каждому действовать так, как им выгодно, оказывается, что всем от этого плохо. Всем было бы лучше, если бы каждый действовал не оптимально для себя, то есть молчал.

Трагедия общины

«Дилемма заключенного» - это игрушечная стилизованная история. Вряд ли вы ожидаете оказаться в подобной ситуации, но похожие эффекты есть везде вокруг нас. Рассмотрим «Дилемму» с большим количеством игроков, ее иногда называют трагедией общины. Например, на дорогах - пробки, и я решаю, как ехать на работу: на машине или на автобусе. Это же делают остальные. Если я поеду на машине, и все решат сделать то же самое, будет пробка, но мы доедем с комфортом. Если я поеду на автобусе, пробка-то все равно будет, но ехать я буду некомфортно и не особо быстрее, поэтому такой исход еще хуже. Если же в среднем все ездят на автобусе, то я, сделав то же самое, довольно быстро доеду без пробки. Но если при таких условиях поехать на машине, я тоже доеду быстро, но еще и с комфортом. Итак, наличие пробки не зависит от моих действий. Равновесие по Нэшу здесь - в ситуации, когда все выбирают ехать на машине. Что бы не делали остальные, мне лучше выбрать машину, потому что будет там пробка или нет, неизвестно, но я в любом случае доеду с комфортом. Это доминирующая стратегия, поэтому в итоге все едут на машине, и мы имеем то, что имеем. Задача государства - сделать поездку на автобусе лучшим вариантом хотя бы для некоторых, поэтому появляются платные въезды в центр, парковки и так далее.

Другая классическая история - рациональное незнание избирателя. Представьте, что вы не знаете исход выборов заранее. Вы можете изучить программу всех кандидатов, послушать дебаты и после проголосовать за самого лучшего. Вторая стратегия - прийти на участок и проголосовать как попало или за того, кого чаще показывали по телевизору. Какое поведение оптимально, если от моего голоса никогда не зависит, кто выиграет (а в 140-миллионной стране один голос никогда ничего не решит)? Конечно, я хочу, чтобы в стране был хороший президент, но я же знаю, что никто больше не будет изучать программы кандидатов внимательно. Поэтому не тратить на это время - доминирующая стратегия поведения.

Когда вас призывают прийти на субботник, ни от кого в отдельности не будет зависеть, станет двор чистым или нет: если я выйду один, я не смогу убрать все, или, если выйдут все, то не выйду я, потому что все и без меня уберут. Другой пример - перевозка грузов в Китае, о котором я узнал в замечательной книге Стивена Ландсбурга «Экономист на диване». 100-150 лет назад в Китае был распространен способ перевозки грузов: все складывалось в большой кузов, который тащили семь человек. Заказчики платили, если груз доставлялся вовремя. Представьте, что вы - один из этих шести. Вы можете прилагать усилия, и тянуть изо всех сил, и если все будут так делать, груз доедет вовремя. Если кто-нибудь один так делать не будет, все тоже доедут вовремя. Каждый думает: «Если все остальные тянут как следует, зачем это делать мне, а если все остальные тянут не со всей силы, то я ничего не смогу изменить». В итоге, со временем доставки все было очень плохо, и сами грузчики нашли выход: они стали нанимать седьмого и платить ему деньги за то, чтобы он стегал лентяев плетью. Само наличие такого человека заставляло всех работать изо всех сил, потому что иначе все попадали в плохое равновесие, из которого никому в отдельности с выгодой не выйти.

Такой же пример можно наблюдать в природе. Дерево, растущее в саду, отличается от того, что растет в лесу, своей кроной. В первом случае она окружает весь ствол, во втором - находится только вверху. В лесу это является равновесием по Нэшу. Если бы все деревья договорились и выросли одинаково, они бы поровну распределили количество фотонов, и всем было бы лучше. Но никому в отдельности так делать невыгодно. Поэтому каждое дерево хочет вырасти немного выше окружающих.

Сommitment device

Во многих ситуациях одному из участников игры может понадобиться инструмент, который убедит остальных, что тот не блефует. Он называется commitment device. Например, закон некоторых стран запрещает платить выкуп похитителям людей, чтобы снизить мотивацию преступников. Однако это законодательство часто не работает. Если вашего родственника захватили, и у вас есть возможность спасти его, обойдя закон, вы это сделаете. Представим ситуацию, что закон можно обойти, но родственники оказались бедными и выкуп им платить нечем. У преступника в этой ситуации два пути: отпустить или убить жертву. Убивать он не любит, но тюрьму он не любит больше. Отпущенный пострадавший, в свою очередь, может либо дать показания, чтобы похититель был наказан, либо молчать. Самый лучший исход для преступника: отпустить жертву, которая его не сдаст. Жертва же хочет быть отпущенной и дать показания.

Равновесие здесь в том, что террорист не хочет быть пойманным, а значит, жертва погибает. Но это не равновесие по Парето, потому что существует вариант, при котором всем лучше - жертва на свободе хранит молчание. Но для этого надо сделать так, чтобы молчать ей было выгодно. Где-то я прочитал вариант, когда она может попросить террориста устроить эротическую фотосессию. Если преступника посадят, его подельники выложат фотографии в интернет. Теперь, если похититель останется на свободе - это плохо, но фотографии в открытом доступе - еще хуже, поэтому получается равновесие. Для жертвы это способ остаться в живых.

Другие примеры игр:

Модель Бертрана

Раз уж мы говорим об экономике, рассмотрим экономический пример. В модели Бертрана два магазина продают один и тот же товар, покупая его у производителя по одной цене. Если цены в магазинах одинаковы, то примерно одинакова и их прибыль, ведь тогда покупатели выбирают магазин случайно. Единственное равновесие по Нэшу здесь - продавать товар по себестоимости. Но магазины хотят зарабатывать. Поэтому если один поставит цену 10 рублей, второй снизит ее на копейку, увеличив тем самым свою выручку вдвое, так как к нему уйдут все покупатели. Поэтому участникам рынка выгодно снижать цены, распределяя тем самым прибыль между собой.

Разъезд на узкой дороге

Рассмотрим примеры выбора между двумя возможными равновесиями. Представьте, что Петя и Маша едут навстречу друг другу по узкой дороге. Дорога настолько узкая, что им обоим нужно съехать на обочину. Если они решат повернуть налево или направо от себя, они просто разъедутся. Если же один повернет направо, а другой налево от себя, или наоборот, случится авария. Как выбрать, куда съехать? Чтобы помогать искать равновесие в подобных играх, существуют, например, правила дорожного движения. В России каждому нужно повернуть направо.

В забаве Chiken, когда два человека едут на большой скорости навстречу друг другу, тоже есть два равновесия. Если оба сворачивают на обочину, возникает ситуация, которая называется Chiken out, если оба не сворачивают, то погибают в страшной аварии. Если я знаю, что мой соперник едет прямо, мне выгодно съехать, чтобы выжить. Если я знаю, что мой соперник съедет, то мне выгодно ехать прямо, чтобы после получить 100 долларов. Сложно предсказать, что случится на самом деле, однако, у каждого из игроков есть свой метод выиграть. Представьте, что я закрепил руль так, что его нельзя повернуть, и показал это своему сопернику. Зная, что у меня нет выбора, соперник отскочит.

QWERTY-эффект

Иногда бывает очень сложно перейти из одного равновесия в другое, даже если оно означает пользу для всех. Раскладка QWERTY была создана, чтобы замедлить скорость печати. Поскольку если бы все печатали слишком быстро, головки печатной машинки, которые бьют по бумаге, цеплялись бы друг за друга. Поэтому Кристофер Шоулз разместил часто стоящие рядом буквы на максимально далеком расстоянии. Если вы зайдете в настройки клавиатуры на своем компьютере, вы сможете выбрать там раскладку Dvorak и печатать гораздо быстрее, так как сейчас нет проблемы аналоговых печатных машин. Дворак рассчитывал, что мир перейдет на его клавиатуру, но мы по-прежнему живем с QWERTY. Конечно, если бы мы перешли на раскладку Дворака, будущее поколение было бы нам благодарно. Все мы приложили бы усилия и переучились, в результате вышло бы равновесие, в котором все печатают быстро. Сейчас мы тоже в равновесии - в плохом. Но никому не выгодно быть единственным, кто переучится, потому что за любым компьютером, кроме личного, работать будет неудобно.

Тео́рия игр - математический метод изучения оптимальных стратегий в играх. Под игрой понимается процесс, в котором участвуют две и более сторон, ведущих борьбу за реализацию своих интересов. Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу - в зависимости от поведения других игроков. Теория игр помогает выбрать лучшие стратегии с учётом представлений о других участниках, их ресурсах и их возможных поступках.

Теория игр - это раздел прикладной математики, точнее - исследования операций. Чаще всего методы теории игр находят применение в экономике, чуть реже в других общественных науках - социологии, политологии, психологии, этике и других. Начиная с 1970-х годов её взяли на вооружение биологи для исследования поведения животных и теории эволюции . Очень важное значение она имеет для искусственного интеллекта и кибернетики, особенно с проявлением интереса к интеллектуальным агентам.

История.

Оптимальные решения или стратегии в математическом моделировании предлагались ещё в XVIII в. Задачи производства и ценообразования в условиях олигополии, которые стали позже хрестоматийными примерами теории игр, рассматривались в XIX в. А. Курно и Ж.Бертраном. В начале XX в. Э.Ласкер, Э.Цермело, Э.Борель выдвигают идею математической теории конфликта интересов.

Математическая теория игр берёт своё начало из неоклассической экономики . Впервые математические аспекты и приложения теории были изложены в классической книге 1944 года Джона фон Неймана и Оскара Моргенштерна «Теория игр и экономическое поведение»(англ. Theory of Games and Economic Behavior ).

Эта область математики нашла некоторое отражение в общественной культуре. В 1998 году американская писательница и журналистка Сильвия Назар издала книгу о судьбе Джона Нэша, нобелевского лауреата по экономике и учёного в области теории игр; а в 2001 по мотивам книги был снят фильм «Игры разума ». Некоторые американские телевизионные шоу, например, «Friend or Foe », «Alias» или «NUMB3RS», периодически ссылаются на теорию в своих эпизодах.

Дж. Нэш в 1949 году пишет диссертацию по теории игр, через 45 лет он получает Нобелевскую премию по экономике. Дж. Нэш после окончания Политехнического института Карнеги с двумя дипломами - бакалавра и магистра - поступил в Принстонский университет, где посещал лекции Джона фон Неймана. В своих трудах Дж. Нэш разработал принципы «управленческой динамики». Первые концепции теории игр анализировали антагонистические игры, когда есть проигравшие и выигравшие за их счет игроки. Нэш разрабатывает методы анализа, в которых все участники или выигрывают, или терпят поражение. Эти ситуации получили названия «равновесие по Нэшу», или «некооперативное равновесие», в ситуации стороны используют оптимальную стратегию, что и приводит к созданию устойчивого равновесия. Игрокам выгодно сохранять это равновесие, так как любое изменение ухудшит их положение. Эти работы Дж. Нэша сделали серьёзный вклад в развитие теории игр, были пересмотрены математические инструменты экономического моделирования. Дж. Нэш показывает, что классический подход к конкуренции А.Смита, когда каждый сам за себя, неоптимален. Более оптимальны стратегии, когда каждый старается сделать лучше для себя, делая лучше для других.

Хотя теория игр первоначально и рассматривала экономические модели, вплоть до 1950-х она оставалась формальной теорией в рамках математики. Но уже с 1950-х гг. начинаются попытки применить методы теории игр не только в экономике, но в биологии, кибернетике, технике, антропологии. Во время Второй мировой войны и сразу после нее теорией игр серьёзно заинтересовались военные, которые увидели в ней мощный аппарат для исследования стратегических решений.

В 1960-1970 гг. интерес к теории игр угасает, несмотря на значительные математические результаты, полученные к тому времени. С середины 1980-х гг. начинается активное практическое использование теории игр, особенно в экономике и менеджменте. За последние 20 - 30 лет значение теории игр и интерес значительно растет, некоторые направления современной экономической теории невозможно изложить без применения теории игр.

Большим вкладом в применение теории игр стала работа Томаса Шеллинга, нобелевского лауреата по экономике 2005 г. «Стратегия конфликта». Т.Шеллинг рассматривает различные «стратегии» поведения участников конфликта. Эти стратегии совпадают с тактиками управления конфликтами и принципами анализа конфликтов в конфликтологии (это психологическая дисциплина) и в управлении конфликтами в организации (теория менеджмента). В психологии и других науках используют слово «игра» в других смыслах, нежели чем в математике. Некоторые психологи и математики скептически относятся к использованию этого термина в других смыслах, сложившихся ранее. Культурологическое понятие игры было дано в работе Йохана Хёйзинга «Homo Ludens» (статьи по истории культуры), автор говорит об использовании игр в правосудии, культуре, этике.. говорит о том, что игра старше самого человека, так как животные тоже играют. Понятие игры встречается в концепции Эрика Бёрна «Игры, в которые играют люди, люди, которые играют в игры». Это сугубо психологические игры, основанные на трансакционном анализе. Понятие игры у Й.Хёзинга отличается от интерпретации игры в теории конфликтов и математической теории игр. Игры также используются для обучения в бизнес-кейсах, семинарах Г. П. Щедровицкого, основоположника организационно-деятельностного подхода. Во время Перестройки в СССР Г. П. Щедровицкий провел множество игр с советскими управленцами. По психологическому накалу ОДИ (организационно-деятельностные игры) были так сильны, что служили мощным катализатором изменений в СССР. Сейчас в России сложилось целое движение ОДИ. Критики отмечают искусственную уникальность ОДИ. Основой ОДИ стал Московский методологический кружок (ММК).

Математическая теория игр сейчас бурно развивается, рассматриваются динамические игры. Однако математический аппарат теории игр затратен. Его применяют для оправданных задач: политика, экономика монополий и распределения рыночной власти и т. п. Ряд известных ученых стали Нобелевскими лауреатами по экономике за вклад в развитие теории игр, которая описывает социально-экономические процессы. Дж. Нэш, благодаря своим исследованиям в теории игр, стал одним из ведущих специалистов в области ведения «холодной войны», что подтверждает масштабность задач, которыми занимается теория игр.

Нобелевскими лауреатами по экономике за достижения в области теории игр и экономической теории стали: Роберт Ауманн , Райнхард Зелтен, Джон Нэш, Джон Харсаньи, Уильям Викри, Джеймс Миррлис, Томас Шеллинг, Джордж Акерлоф, Майкл Спенс, Джозеф Стиглиц , Леонид Гурвиц, Эрик Мэскин, Роджер Майерсон, Ллойд Шепли, Элвин Рот.

Применение теории игр.

Теория игр, как один из подходов в прикладной математике, применяется для изучения поведения человека и животных в различных ситуациях. Первоначально теория игр начала развиваться в рамках экономической науки, позволив понять и объяснить поведение экономических агентов в различных ситуациях. Позднее область применения теории игр была расширена на другие социальные науки; в настоящее время теория игр используется для объяснения поведения людей в политологии, социологии и психологии. Теоретико-игровой анализ был впервые использован для описания поведения животных Рональдом Фишером в 30-х годах XX века (хотя даже Чарльз Дарвин использовал идеи теории игр без формального обоснования). В работе Рональда Фишера не появляется термин «теория игр». Тем не менее, работа по существу выполнена в русле теоретико-игрового анализа. Разработки, сделанные в экономике, были применены Джоном Майнардом Смитом в книге «Эволюция и теория игр». Теория игр используется не только для предсказания и объяснения поведения; были предприняты попытки использовать теорию игр для разработки теорий этичного или эталонного поведения. Экономисты и философы применяли теорию игр для лучшего понимания хорошего (достойного) поведения. Вообще говоря, первые теоретико-игровые аргументы, объясняющие правильное поведения, высказывались ещё Платоном.

Описание и моделирование.

Первоначально теория игр использовалась для описания и моделирования поведения человеческих популяций. Некоторые исследователи считают, что с помощью определения равновесия в соответствующих играх они могут предсказать поведение человеческих популяций в ситуации реальной конфронтации. Такой подход к теории игр в последнее время подвергается критике по нескольким причинам. Во-первых, предположения, используемые при моделировании, зачастую нарушаются в реальной жизни. Исследователи могут предполагать, что игроки выбирают поведения, максимизирующее их суммарную выгоду (модель экономического человека), однако на практике человеческое поведение часто не соответствует этой предпосылке. Существует множество объяснений этого феномена - нерациональность, моделирование обсуждения, и даже различные мотивы игроков (включая альтруизм). Авторы теоретико-игровых моделей возражают на это, говоря, что их предположения аналогичны подобным предположениям в физике. Поэтому даже если их предположения не всегда выполняются, теория игр может использовать как разумная идеальная модель, по аналогии с такими же моделями в физике. Однако, на теорию игр обрушился новый вал критики, когда в результате экспериментов было выявлено, что люди не следуют равновесным стратегиям на практике. Например, в играх «Сороконожка», «Диктатор» участники часто не используют профиль стратегий, составляющий равновесие по Нэшу. Продолжаются споры о значении подобных экспериментов. Согласно другой точке зрения, равновесие по Нэшу не является предсказанием ожидаемого поведения, но лишь объясняет, почему популяции, уже находящиеся в равновесии по Нэшу, остаются в этом состоянии. Однако вопрос о том, как эти популяции приходят к равновесию Нэша, остается открытым. Некоторые исследователи в поисках ответа на этот вопрос переключились на изучение эволюционной теории игр. Модели эволюционной теории игр предполагают ограниченную рациональность или нерациональность игроков. Несмотря на название, эволюционная теория игр занимается не только и не столько вопросами естественного отбора биологических видов. Этот раздел теории игр изучает модели биологической и культурной эволюции, а также модели процесса обучения.

Нормативный анализ (выявление наилучшего поведения).

С другой стороны, многие исследователи рассматривают теорию игр не как инструмент предсказания поведения, но как инструмент анализа ситуаций с целью выявления наилучшего поведения для рационального игрока. Поскольку равновесие Нэша включает стратегии, являющиеся наилучшим откликом на поведение другого игрока, использование концепции равновесия Нэша для выбора поведения выглядит вполне обоснованным. Однако, и такое использование теоретико-игровых моделей подверглось критике. Во-первых, в некоторых случаях игроку выгодно выбрать стратегию, не входящую в равновесие, если он ожидает, что другие игроки также не будут следовать равновесным стратегиям. Во-вторых, знаменитая игра «Дилемма заключенного » позволяет привести ещё один контрпример. В «Дилемме заключенного » следование личным интересам приводит к тому, что оба игрока оказываются в худшей ситуации в сравнении с той, в которой они пожертвовали бы личными интересами.

Типы игр

Кооперативные и некооперативные.

Игра называется кооперативной, или коалиционной , если игроки могут объединяться в группы, взяв на себя некоторые обязательства перед другими игроками и координируя свои действия. Этим она отличается от некооперативных игр, в которых каждый обязан играть за себя. Развлекательные игры редко являются кооперативными, однако такие механизмы нередки в повседневной жизни.

Часто предполагают, что кооперативные игры отличаются именно возможностью общения игроков друг с другом. В общем случае это неверно. Существуют игры, где коммуникация разрешена, но игроки преследуют личные цели, и наоборот.

Из двух типов игр, некооперативные описывают ситуации в мельчайших деталях и выдают более точные результаты. Кооперативные рассматривают процесс игры в целом. Попытки объединить два подхода дали немалые результаты. Так называемая программа Нэша уже нашла решения некоторых кооперативных игр как ситуации равновесия некооперативных игр.

Гибридные игры включают в себя элементы кооперативных и некооперативных игр. Например, игроки могут образовывать группы, но игра будет вестись в некооперативном стиле. Это значит, что каждый игрок будет преследовать интересы своей группы, вместе с тем стараясь достичь личной выгоды.

Симметричные и несимметричные.

Игра будет симметричной тогда, когда соответствующие стратегии у игроков будут равны, то есть иметь одинаковые платежи. Иначе говоря, если игроки могут поменяться местами и при этом их выигрыши за одни и те же ходы не изменятся. Многие изучаемые игры для двух игроков - симметричные. В частности, таковыми являются: «Дилемма заключённого», «Охота на оленя », «Ястребы и голуби». В качестве несимметричных игр можно привести «Ультиматум » или «Диктатор ».

В примере справа игра на первый взгляд может показаться симметричной из-за похожих стратегий, но это не так - ведь выигрыш второго игрока при профилях стратегий (А, А) и (Б, Б) будет больше, чем у первого.

С нулевой суммой и с ненулевой суммой.

Игры с нулевой суммой - особая разновидность игр с постоянной суммой , то есть таких, где игроки не могут увеличить или уменьшить имеющиеся ресурсы, или фонд игры. В этом случае сумма всех выигрышей равна сумме всех проигрышей при любом ходе. Посмотрите направо - числа означают платежи игрокам - и их сумма в каждой клетке равна нулю. Примерами таких игр может служить покер, где один выигрывает все ставки других; реверси, где захватываются фишки противника; либо банальное воровство .

Многие изучаемые математиками игры, в том числе уже упоминавшаяся «Дилемма заключённого», иного рода: в играх с ненулевой суммой выигрыш какого-то игрока не обязательно означает проигрыш другого, и наоборот. Исход такой игры может быть меньше или больше нуля. Такие игры могут быть преобразованы к нулевой сумме - это делается введением фиктивного игрока , который «присваивает себе» излишек или восполняет недостаток средств.

Ещё игрой с отличной от нуля суммой является торговля , где каждый участник извлекает выгоду. Широко известным примером, где она уменьшается, является война .

Параллельные и последовательные.

В параллельных играх игроки ходят одновременно, или, по крайней мере, они не осведомлены о выборе других до тех пор, пока все не сделают свой ход. В последовательных, или динамических , играх участники могут делать ходы в заранее установленном либо случайном порядке, но при этом они получают некоторую информацию о предшествующих действиях других. Эта информация может быть даже не совсем полной , например, игрок может узнать, что его противник из десяти своих стратегий точно не выбрал пятую, ничего не узнав о других.

Различия в представлении параллельных и последовательных игр рассматривались выше. Первые обычно представляют в нормальной форме, а вторые - в экстенсивной.

С полной или неполной информацией.

Важное подмножество последовательных игр составляют игры с полной информацией. В такой игре участники знают все ходы, сделанные до текущего момента, равно как и возможные стратегии противников, что позволяет им в некоторой степени предсказать последующее развитие игры. Полная информация не доступна в параллельных играх, так как в них неизвестны текущие ходы противников. Большинство изучаемых в математике игр - с неполной информацией. Например, вся «соль» Дилеммы заключённого или Сравнения монеток заключается в их неполноте.

В то же время есть интересные примеры игр с полной информацией: «Ультиматум», «Многоножка ». Сюда же относятся шахматы, шашки, го, манкала и другие.

Часто понятие полной информации путают с похожим - совершенной информации . Для последнего достаточно лишь знание всех доступных противникам стратегий, знание всех их ходов необязательно.

Игры с бесконечным числом шагов.

Игры в реальном мире или изучаемые в экономике игры, как правило, длятся конечное число ходов. Математика не так ограничена, и в частности, в теории множеств рассматриваются игры, способные продолжаться бесконечно долго. Причём победитель и его выигрыш не определены до окончания всех ходов.

Задача, которая обычно ставится в этом случае, состоит не в поиске оптимального решения, а в поиске хотя бы выигрышной стратегии . Используя аксиому выбора, можно доказать, что иногда даже для игр с полной информацией и двумя исходами - «выиграл» или «проиграл» - ни один из игроков не имеет такой стратегии. Существование выигрышных стратегий для некоторых особенным образом сконструированных игр имеет важную роль в дескриптивной теории множеств .

Дискретные и непрерывные игры.

Большинство изучаемых игр дискретны : в них конечное число игроков, ходов, событий, исходов и т. п. Однако эти составляющие могут быть расширены на множество вещественных чисел. Игры, включающие такие элементы, часто называются дифференциальными. Они связаны с какой-то вещественной шкалой (обычно - шкалой времени), хотя происходящие в них события могут быть дискретными по природе. Дифференциальные игры также рассматриваются в теории оптимизации, находят своё применение в технике и технологиях, физике.

Метаигры.

Это игры, результатом которых является набор правил для другой игры (называемой целевой или игрой-объектом ). Цель метаигр - увеличить полезность выдаваемого набора правил. Теория метаигр связана с теорией оптимальных механизмов .

по материалам wikipedia.org