Примеры

Пример 1.

Определите стратегии игроков для игры, матрица которой имеет следующий вид.

A   \   B

b1

b2

b3

b4

Минимальный выигрыш Игрока 1

a1

10

40

12

9

9

a2

17

16

13

14

13

a3

23

8

10

25

8

Максимальный проигрыш Игрока 2

23

40

13

25

Решение.

В этой игре партнер 1 имеет три возможные стратегии: a1, a2, a3 , а партнер 2 – четыре возможные стратегии b1, b2, b3, b4. Рассмотрим процесс принятия игроками решения (предполагается, что они принимают в данной ситуации рациональные решения). Взглянув на таблицу, можно заметить, что если игрок 1 не знает, как поступит его противник, то действуя наиболее целесообразно и, считая, что противник будет действовать подобным же образом, он выберет стратегию a2, которая гарантирует ему наибольший из трех возможных наименьших выигрышей: 9, 13, 8. Другими словами, игрок 1 руководствуется принципом максиминного выигрыша. Этот выигрыш a = max min aij . есть нижняя цена игры. Для нашего примера a=13.

Игрок 2 рассуждает аналогично: Если он выберет стратегию b1, то потеряет самое большее 23, если стратегию b2, то 40 и т.д. В результате он выберет стратегию b3, которая гарантирует ему наименьший из четырех возможных проигрышей: 23, 40, 13, 25. Принято говорить, игрок 2 руководствуется принципом минимаксного проигрыша. Этот проигрыш b = min max aij . Для нашей матрицы b=13.

Cитуация (a2, b3) есть седловая точка, и a=b=13 есть цена игры.

При наличии седловой точки ни одному из участников игры невыгодно отклоняться от своей минимаксной стратегии: он будет наказан противником, тем, что получит меньший выигрыш.

Пример 2. Где строить?

Две конкурирующие крупные торговые фирмы F1 и F2, планируют построить в одном из четырех небольших городов G1, G2, G3, и G4, лежащих вдоль автомагистрали, по одному универсаму. Взаимное расположение городов, расстояние между ними и численность населения показаны на следующей схеме:

140 км 30 км 40 км 50 км 150 км
------------------------ G1----------- G2-------------- G3--------------------- G4-----------------------------
Число покупателей 30 тыс 50 тыс 40 тыс 30 тыс

Доход, получаемый каждой фирмой, определяется численностью населения городов, а также степенью удаленности универсамов от места жительства потенциальных покупателей. Специально проведенное исследование показало, что доход универсамов будет распределяться между фирмами так, как это показано в следующей таблице:

  Распределение дохода между фирмами
Условия F1 F2
Универсам фирмы F1 расположен от города ближе универсама фирмы F2 75% 25%
Универсамы обеих фирм расположены на одинаковом расстоянии от города 60% 40%
Универсам фирмы F1 расположен от города дальше универсама фирмы F2 45% 55%

Например, если универсам фирмы F1 расположен от города G1 ближе универсама фирмы F2, то доход фирм от покупок, сделанных жителями данного города, распределится следующим образом: 75% получит F1, остальное – F2.

а) Представьте описанную ситуацию, как игру двух лиц;

б) В каких городах фирмам целесообразно построить свои универсамы?

Решение.

Составим платежную матрицу игры, в которой игроком 1 будет фирма F1, а игроком 2 фирма F2. Стратегии обоих игроков: строить свой универсам в городе G1, строить в городе G2 и т.д. Элементы матрицы - объемы дохода фирмы F1 (в тыс.), которые, как предполагается, пропорциональны (причем с одним и тем же коэффициентом) числу покупателей. Величина указанного коэффициента пропорциональности, с точки зрения выбора оптимального места размещения универсамов, значения не имеет, поэтому примем его равным единице.

Платежная матрица имеет вид:

G1 G2 G3 G4
G1 90 76,5 91,5 91,5
G2 103,5 90 91,5 103,5
G3 88,5 88,5 90 103,5
G4 88,5 76,5 76,5 90

Рассмотрим примеры расчета значений элементов (G1,G2) и (G3,G4) матрицы.

Ситуация (G1,G2) означает, что фирма F1 строит универсам в городе G1, а фирма F2 – в городе G2. Число покупателей фирмы F1 складывается из покупателей четырех городов. Для ситуации (G1,G2) число покупателей из G1: 0,75* 30, из G2: 0,45*50, из G3:0,45*40, из G4:0,45*30, т.е. в сумме 76,5. Для ситуации (G3,G4) число покупателей из G1: 0,75* 30, из G2: 0,75*50, из G3:0,75*40, из G4:0,45*30, т.е. в сумме 103,5. Элементы матрицы выигрышей фирмы F2 – дополнения до числа 150 (общее число жителей в четырех городах). Таким образом, имеет место игра двух лиц с ненулевой постоянной суммой, оптимальные стратегии которой те же, что и для соответствующей игры с нулевой суммой. Полученная платежная матрица имеет седловую точку (G2,G2). Соответствующий элемент матрицы равен 90.

Таким образом, обеим фирмам следует строить свои универсамы в одном и том же городе G2, при этом, число покупателей (доход ) F1 составит 90 тыс., а у фирмы F2 - 60 тыс.

Пример 3. Двухпальцевая игра морра

Каждый игрок показывает один или два пальца и называет число пальцев, которое, по его мнению, показал его противник (ни один из игроков не видит, какое число пальцев на самом деле показывает его противник). Если один из игроков угадывает правильно, он выигрывает сумму, равную сумме числа пальцев, показанных им и его противником. В противном случае (если никто не угадывает), - ничья. Если оба угадали, то оба платят друг другу одинаковую сумму, в результате – ничья (0).

Вопросы.

1. Существует ли в данной игре седловая точка в чистых стратегиях?

2. Кто из игроков в среднем выигрывает и сколько?

3. Как часто игрок 1 должен говорить, что его противник показал два пальца?

4. Как часто игрок 2 должен показывать 1 палец?

Решение.

Прежде всего, определим стратегии игроков и построим платежную матрицу.

Стратегиями игрока 1 (строки таблицы) являются четыре пары чисел. Первое число каждой пары – это число пальцев, показанное им, второе – число пальцев, которое, как он предполагает, показал его противник. Такие же стратегии имеет игрок 2.

Платежная матрица размером 4х4 и другая информация представлена в следующей таблице:

B                                     A

(1,1)

(1,2)

(2,1)

(2,2)

Минимальный выигрыш Игрока 1

(1,1)

0

2

-3

0

-3

(1,2)

-2

0

0

3

- 2

(2,1)

3

0

0

- 4

- 4

(2,2)

0

-3

4

0

-3

Максимальный проигрыш Игрока 2

3

2

4

3

Нижняя цена игры a= - 2, верхняя цена игры b= 2, поэтому седловой точки не существует и решение в чистых стратегиях отсутствует. Для решения данной игры построим соответствующую задачу линейного программирования. Для этого сначала преобразуем платежную матрицу таким образом, чтобы все ее элементы были положительными. Максимальная по абсолютной величине величина неположительного элемента платежной матрицы равна 4, поэтому к матрице достаточно прибавить число 5. Получим

5

7

2

5

3

5

5

8

8

5

5

1

5

2

9

5

Оптимальная стратегия игрока 1 находится решением следующей задачи линейного программирования (см. (1)):

x1+ x2+ x3 + x4 ® min

5x1 + 3x2 + 8x3 + 5x4 і 1

7x1 + 5x2 + 5x3 + 2x4 і 1

2x1 + 5x2 + 5x3 + 9x4 і 1

5x1 + 8x2 + 1x3 + 5x4 і 1

xi і 0 , (i=1,..., 4)

Используя пакет POM for WINDOWS, исходную информацию для решения этой задачи можно представить в виде следующей таблицы:

Стратегии игрока 1 Стратегии игрока 2.
Minimize 1 1 1 1
Стратегия 1 5 3 8 5 >= 1
Стратегия 2 7 5 5 2 >= 1
Стратегия 3 2 5 5 9 >= 1
Стратегия 4 5 8 1 5 >= 1

Решая эту задачу, получаем следующий результат:

Стратегии игрока 1 Стратегии игрока 2
Minimize 1 1 1 1
Стратегия 1 5 3 8 5 >= 1 0
Стратегия 2 7 5 5 2 >= 1 -0,114
Стратегия 3 2 5 5 9 >= 1 -0,086
Стратегия 4 5 8 1 5 >= 1 0
Решение-> 0 0,114 0 0,086 0,2

Решение (в нижней строке): x1=0, x2 =0,114, x3=0, x4 =0,086,

оптимальное значение целевой функции равно 0,2.

В последнем столбце (первые 4 числа) – двойственные оценки.

Переходя к переменным исходной задачи, получаем v = 1/ (x1+ x2+ x3+ x4) = 5. Так как pi = xi * v, получаем: p1=0, p2 =0,572, p3=0, p4 =0,429. Это означает, что при многократном повторении игры первая стратегия (1,1) и третья стратегия (2,1) игроком 1 не должны использоваться; вторая стратегия (1,2) использоваться с частотой 0,572, четвертая стратегия – с частотой 0,427. Аналогично определяем оптимальную стратегию игрока 2: q1=0, q2 =0,5715 (5 * 0,1143), q3=0,4285 (5 * 0,0857), q4 =0, т.е. игрок 2 должен использовать лишь свою вторую стратегию (1,2) с частотой 0,5715 и третью стратегию (2,1) с частотой 0,4285.

Вспоминая, что исходная матрица была увеличена на 5, цена первоначальной игры равна 0. Таким образом, исход игры - ничья.

Ответы на вопросы.

1. Седловой точки в чистых стратегиях в данной игре не существует.

2. Ничья.

3. Всегда.

4. 0,572.

Пример 3. Доминирование стратегий.

Исходная матрица игры имеет вид:

3

4

-8

0

5

4

3

1

2

0

5

4

-8

0

5

4

3

0

0

-1

-2

3

0

2

0

0

0

1

1

0

Существуют ли доминирующие стратегии?  Если да - исключите их и постройте новую матрицу игры.

Решение.

Для игрока1 : вторая стратегия (строка 2 матрицы) доминирует четвертую и шестую стратегии, поэтому четвертую и шестую строки можно вычеркнуть. Для игрока 2: третья стратегия (столбец 3) доминирует четвертую стратегию, поэтому столбец 4 можно вычеркнуть и т.д. Результирующая матрица имеет вид:

1

0

-8

5

Пример 4. Как завоевать рынок.

Два конкурирующих друг с другом предприятия, выпускающие стиральные машины, имеют следующие доли общего сбыта своей продукции на местном рынке: 53% у предприятия 1 и 47% - у предприятия 2. Оба предприятия пытаются увеличить объем своих продаж. Для этого у них есть следующие альтернативы: a1 (b1)- расширить сеть сбыта; a2 (b2)- реклама; a3 (b3)- увеличить ассортимент (число моделей стиральных машин); a4 (b4)- ничего не предпринимать. Анализ показал, что изменения доли (в %) предприятия 1 на рынке стиральных машин в случае осуществления обоими предприятиями указанных мероприятий, могут быть следующими.

  b1 b2 b3 b4
a1 -4 -1 -3 6
a2 -5 0 1 5
a3 -1 -3 -5 5
a4 -8 -7 -6 0

Сформулировать данную ситуацию в виде игры.

Вопросы.

1. Какое из мероприятий предприятия 1 наиболее эффективно?

2. Как изменится доля предприятия 1 на рынке?

3. Какое из мероприятий предприятия 2 наиболее эффективно?

4. С какой частотой следует предприятию 2 использовать стратегию "реклама"?

Решение.

Приведенную выше таблицу можно рассматривать как платежную матрицу игры двух лиц с нулевой суммой. Альтернативы, имеющиеся в распоряжении предприятий, - стратегии игроков. Прежде всего, следует исключить доминируемые стратегии игроков: a4 игрока 1 и b4 игрока 2.

  b1 b2 b3
a1 -4 -1 -3
a2 -5 0 1
a3 -1 -3 -5

Увеличив все элементы матрицы на 6, решим следующую задачу линейного программирования.

x1 + x2 + x3 ® min

2x1 + 5x2 + 3x3 і 1

x1 + 6x2 + 7x3 і 1

5x1 + 3x2 + x3 і 1

xi і 0 , (i=1, 2, 3)

Используя пакет POM for WINDOWS, получаем следующий результат:

Minimize 1 1 1
Constraint 1 2 5 3 >= 1 -0,1052631
Constraint 2 1 6 7 >= 1 0
Constraint 3 5 3 1 >= 1 -0,1578947
Solution-> 0,105 0,158 0 0,26

Переходя к переменным исходной задачи и учитывая, что v = 1/ (x1+ x2+ x3) =3.85

и pi = xi * v, получаем: p1=0,4, p2 =0,6, p3=0, p4=0. Цена игры, соответствующая первоначальной матрице, равна -2,15 (3,85-6). Таким образом, предприятие 1 при многократном повторении игры стратегию a1- расширить сеть сбыта- должно использовать с частотой 0,4, стратегию a2 - реклама – с частотой 0,6, а стратегиии a3- увеличить ассортимент- и a4- ничего не предпринимать- не использовать вовсе. При этом доля сбыта предприятия на рынке уменьшится на 2,15%. Оптимальная смешанная стратегия предприятия 2 : с частотой 0,4 использовать стратегию b1- расширить сеть сбыта- и : с частотой 0,6 использовать стратегию b3- увеличить ассортимент. Стратегии a2 - реклама и a4- ничего не делать- не применять вовсе. Доля предприятия 2 на рынке увеличится на 2,15%. Казалось бы, поскольку в результате осуществления своих мероприятий предприятие 1 "теряет рынок", ему не следует ничего предпринимать, однако в этом случае оно потеряет еще больше (в соответствии со стратегией a4) из-за действий предприятия 2, которому они выгодны.

Ответы на вопросы.

1. Наиболее эффективным мероприятием для предприятия 1 является реклама.

2. Доля предприятия 1 на рынке уменьшится на 2,15%.

3. Наиболее эффективным мероприятием для предприятия 2 является увеличение ассортимента.

4. С нулевой частотой, т.е. мероприятие "реклама " предприятием 2 вообще не должно применяться.