Решение матричной игры

Автор работы: Пользователь скрыл имя, 04 Июня 2013 в 15:04, задача

Краткое описание

Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 2, которая указывает на максимальную чистую стратегию A2.
Верхняя цена игры b = min(bj) = 3.
Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 2 <= y <= 3. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).

Вложенные файлы: 1 файл

Решение матричной игры.docx

— 311.98 Кб (Скачать файл)

Решение матричной  игры

Игроки

B1

B2

a = min(Ai)

A1

0

3

0

A2

5

2

2

b = max(Bi)

5

3

 

Находим гарантированный  выигрыш, определяемый нижней ценой  игры a = max(ai) = 2, которая указывает на максимальную чистую стратегию A2. 
Верхняя цена игры b = min(bj) = 3. 
Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 2 <= y <= 3. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии) 

Решим задачу геометрическим методом, который включает в себя следующие этапы: 
1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии B1, правый - стратегии B(x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S= (p1,p2). 
2. На левой оси ординат откладываются выигрыши стратегии B1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии B2
Решение игры (m x 2) проводим с позиции игрока B, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет. 
Максиминной оптимальной стратегии игрока B соответствует точка N, лежащая на пересечении прямых A1Aи A2A2, для которых можно записать следующую систему уравнений: 
y = 0 + (3 - 0)q2 
y = 5 + (2 - 5)q2 
Откуда 
q1/6 
q5/6 
Цена игры, y = 21/2 
Теперь можно найти минимаксную стратегию игрока A, записав соответствующую систему уравнений 
5p= y 
3p1+2p= y 
p1+p= 1 
или 
5p= 21/2 
3p1+2p= 21/2 
p1+p= 1 
Решая эту систему методом обратной матрицы, находим: 
p1/2 
p1/2

1. Проверяем, имеет ли платежная  матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.

Считаем, что  игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию  так, чтобы минимизировать выигрыш  игрока I.

Игроки

B1

B2

a = min(Ai)

A1

0

3

0

A2

5

2

2

b = max(Bi)

5

3

 

 

 

Находим гарантированный  выигрыш, определяемый нижней ценой  игры a = max(ai) = 2, которая указывает на максимальную чистую стратегию A2.

Верхняя цена игры b = min(bj) = 3.

Что свидетельствует  об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 2 ≤ y ≤ 3. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).

2. Проверяем платежную матрицу  на доминирующие строки и доминирующие  столбцы.

Иногда на основании простого рассмотрения матрицы  игры можно сказать, что некоторые  чистые стратегии могут войти  в оптимальную смешанную стратегию  лишь с нулевой вероятностью.

Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ≥ akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) – доминирующая, k-я – доминируемая.

Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M  aij ≤ ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю – доминируемой.

В платежной  матрице отсутствуют доминирующие строки.

В платежной  матрице отсутствуют доминирующие столбцы.

Так как игроки выбирают свои чистые стратегии случайным  образом, то выигрыш игрока I будет  случайной величиной. В этом случае игрок I должен выбрать свои смешанные  стратегии так, чтобы получить максимальный средний выигрыш.

Аналогично, игрок II должен выбрать свои смешанные  стратегии так, чтобы минимизировать математическое ожидание игрока I.

3. Находим решение игры в смешанных  стратегиях.

Математические  модели пары двойственных задач линейного  программирования можно записать так:

найти минимум  функции F(x) при ограничениях:

5x2 ≥ 1

3x1+2x2 ≥ 1

F(x) = x1+x2 → min

найти максимум функции Ф(y) при ограничениях:

3y2 ≤ 1

5y1+2y2 ≤ 1

Ф(y) = y1+y2 → max

Решаем эти  системы симплексным методом.

Решение симплекс-методом доступно в расширенном  режиме.

Цена игры будет равна g = 1/F(x), а вероятности применения стратегий игроков:

pi = g*xi; qi = g*yi.

Цена игры: g = 1 : 2/5 = 21/2

p1 = 21/21/5 = ½ p2 = 21/21/5 = 1/2

Оптимальная смешанная стратегия игрока I:

P = (1/2; 1/2)

q1 = 21/21/15 = 1/6  q2 = 21/21/3 = 5/6

Оптимальная смешанная стратегия игрока II:

Q = (1/6; 5/6) Цена игры: v=21/2

4. Проверим  правильность решения игры с  помощью критерия оптимальности стратегии.

∑aijqj ≤ v

∑aijpi ≥ v

M(P1;Q) = (0•1/6) + (3•5/6)  = 2.5 = v M(P2;Q) = (5•1/6) + (2•5/6)  = 2.5 = v M(P;Q1) = (0•1/2) + (5•1/2)  = 2.5 = v M(P;Q2) = (3•1/2) + (2•1/2)  = 2.5 = v

Все неравенства  выполняются как равенства или  строгие неравенства, следовательно, решение игры найдено верно.


Информация о работе Решение матричной игры