Метод Гурвица
ожной фактической информации называется стратегий игрока.
Главным в исследовании теории игр является выбор оптимальных стратегий
игроков. Стратегия игрока является оптимальной, если применение этой
стратегии обеспечит ему наибольший гарантированный выигрыш при всевозможных
стратегиях другого игрока. В процессе одной игры каждый из игроков выбирает
одну стратеги. Стратегии делятся на чистые и смешанные.
Чистая стратегия – это стратегия, имеющая одно единственное значение
или решение из множества заданных.
Смешанная (сложная) стратегия – это стратегия, которая берёт m значений
с соответствующими вероятностями.
Стороны участвующие в конфликтной ситуации называются игроками, а
предполагаемые действия каждого из игроков, направленные на достижение
некоторой цели, называется правилами игры.
Платёж – это количественная оценка результатов игры.
Ходом в теории игр называется выбор одного из предложенных правилами
игры действий его осуществлении.
Состязательная задача – это задача, разрешающая конфликтные ситуации
между двумя или более противниками с целью нахождения оптимальной стратегии
для каждого игрока, и в конечном итоге игрока, разрешающего конфликтную
ситуацию.
Игру двух игроков можно описать как производственный процесс с помощью
следующей функциональной схемы (рис.1).
Рисунок 2.1.1
Оба игрока по прямой связи U(t) делает ход, выбирая предполагаемую
стратегию. Ни один из игроков не знает хода противника. В случае если игрок
узнает стратегию своего противника, то по обратной связи f(t) поступает
сигнал, что он может отказаться от своей старой стратегии и выбрать другую
стратегию. Востановив работу по прямой связи U(t).
Человек А в играх с природой старается действовать осмотрительно,
используя, например, минимаксную стратегию, позволяющую получить наименьший
проигрыш. Второй игрок В (природа) действует совершенно случайно, возможные
стратегии определяются как её состояние. Условия игры задаются в виде
матрицы.
[pic]
Элементы Сij = выигрышу игрока А, если он использует стратегию Аi.
В данном курсовом проекте состязательная задача решается по методу
Гурвица.
Пусть в игре принимают участие два игрока А и В.
Рассматривается конфликтная ситуация между двумя сторонами А и В. Игрок
А имеет m стратегий, а В имеет n стратегий: А={А1, А1,…, А1}; В={В1, В1,…,
В1}.
Взаимосвязь между стратегиями любого из игроков определяется платёжной
матрицей С={Cij}m*n. Cij – выигрыш игрока А. Заданы статистические
коэффициенты оптимизации ([pic]).
Цель игры состоит в том, чтобы вывести ситуацию из условия
неопределённости, найти максимальный выигрыш, по которому определить
оптимальную стратегию каждого игрока, а также игрока разрешающего
конфликтную ситуацию.
Решение игры и исходные данные сводятся в таблицу Гурвица (табл.
2.1.1).
Таблица 2.1.1
| |В1 |В2 |… |Вn |Наименьший|Наибольший |Коэффициенты |
| | | | | | |выигрыш |оптимизма |
| | | | | |выигрыш | | |
| | | | | | |0,1 |0,2 |0,3 |
|А1 |1 |1 |3 |1 |3 |2,8 |2,6 |2,4 |
|А2 |5 |6 |8 |5 |8 |7,7 |7,4 |7,1 |
|А3 |4 |3 |5 |3 |5 |4,8 |4,6 |4,4 |
Найти игрока, разрешающего конфликтную ситуацию.
Найдём условно расчётные выигрыши игрока А по формуле:
[pic]
V11=0,1*1+(1 – 0,1)*3=2,8
V12=0,2*1+(1 – 0,2)*3=2,6
V13=0,3*1+(1 – 0,3)*3=2,4
V21=0,1*5+(1 – 0,1)*8=7,7
V22=0,2*5+(1 – 0,2)*8=7,4
V23=0,3*5+(1 – 0,3)*8=7,1
V31=0,1*3+(1 – 0,1)*5=4,8
V32=0,2*3+(1 – 0,2)*5=4,6
V33=0,3*3+(1 – 0,3)*5=4,4
Среди найденных условных расчётных выигрышей найдём максимальный. Он
равен 7.7, значит оптимальная стратегия игрока А будет А2.
Далее найдём оптимальная стратегия игрока В, для этого транспонируем
матрицу. Результаты заносим в таблицу 2.8.2.
Таблица 2.8.2
| |А1 |А2 |А3 |Наименьший |Наибольший |Коэффициенты |
| | | | |выигрыш |выигрыш |оптимизма |
| | | | |[pic] |[pic] | |
| | | | | | |0,1 |0,2 |0,3 |
|В1 |1 |5 |4 |1 |5 |4,6 |4,2 |3,8 |
|В2 |1 |6 |3 |1 |6 |5,5 |5 |4,5 |
|В3 |3 |8 |5 |3 |8 |7,5 |7 |6,5 |
Найдём условно расчётные выигрыши игрока В
V11=0,1*1+(1 – 0,1)*5=4,6
V12=0,2*1+(1 – 0,2)*5=4,2
V13=0,3*1+(1 – 0,3)*5=3,8
V21=0,1*1+(1 – 0,1)*6=5,5
V22=0,2*1+(1 – 0,2)*6=5
V23=0,3*1+(1 – 0,3)*6=4,5
V31=0,1*3+(1 – 0,1)*8=7,5
V32=0,2*3+(1 – 0,2)*8=7
V33=0,3*3+(1 – 0,3)*8=6,5
Среди найденных условных расчётных выигрышей найдём максимальный. Он
равен 7.5, значит оптимальная стратегия игрока В будет В3.
Из 2-х оптимальных стратегий, находим наибольший выигрыш, а именно
7,7>7,5; следовательно игрок А разрешит конфликтную ситуацию с
максимальным выигрышем равным 7,7, стратегия которого равна 2.
2 Оценки результатов решения задачи
Результат решения задачи полностью соответствует заданию курсового
проекта. В сравнении результатов решения задачи ручным с результатами
автоматизированным методом, получил одинаковые результаты. Что означает что
программа работает верно. Преимущество автоматизированного метода над
ручным состоит в том, что автоматизированное время выполнения программы
меньше, чем ручным.
ЗАКЛЮЧЕНИЕ
Данная курсовая работа включает в себя два предмета: «Программирование»
и «Компьютерное модулирование»
В курсовой работе были рассмотрены следующие вопросы:
. Рассмотрена характеристика «Теории игр» и следующие методы ее решения:
метод Гурвица, метод Сэвиджа, метод максимина.
. Рассмотрен и дан алгоритм решения теории игры в условии
неопределенности методом Гурвица.
. Дана краткая характеристика ПК, включая анализ средств
программирования, описания ОС MS-DOS и MS Windows’
. Рассмотрен выбор языка программирования.
. Написана программа для решения данной задачи.
СПИСОК ЛИТЕРАТУРЫ
1. Г. С. Малик «Основы экономики и математические методы в планировании».
2. Кузнецов «Математическое программирование».
3. В. В. Фаронов «Delphi 5. Учебный курс».
4. Ю. П. Зайченко «Исследование операций в задачах, алгоритмах,
программах».
Приложение 1 Текст программы
Medot_Gurwiwiza.dpr
program Medot_Gurwiza;
{Курсовой проект по предмету "Компьютерное модулирование" по теме "Теория
игр"
Принцип Гурвица Выполнил студент гр. П-00-1 Юшков Андрей 10.06.02}
uses
Forms,
osnowa in 'osnowa.pas' {form1},
Unit2 in 'Unit2.pas' {Form2};
{$R *.RES}
begin
Application.Initialize;
Application.CreateForm(Tform1, form1);
Application.CreateForm(TForm2, Form2);
Application.Run;
end.
unit osnowa;
interface
uses
Windows, Messages, SysUtils, Classes, Graphics, Controls, Forms, Dialogs,
Grids, StdCtrls, ToolWin, ComCtrls, Buttons, ActnList, StdActns, Menus,
Mask, ExtCtrls, jpeg;
type
Tform1 = class(TForm)
tabliza: TStringGrid;
Panel1: TPanel;
Button1: TButton;
Edit1: TEdit;
Edit2: TEdit;
Edit3: TEdit;
Label2: TLabel;
Label3: TLabel;
Label4: TLabel;
C_S: TStringGrid;
Panel2: TPanel;
Label5: TLabel;
Label6: TLabel;
Label7: TLabel;
Label8: TLabel;
Label9: TLabel;
Label10: TLabel;
Label11: TLabel;
Label12: TLabel;
Label13: TLabel;
Label14: TLabel;
Panel3: TPanel;
Panel4: TPanel;
Label17: TLabel;
Label18: TLabel;
Panel5: TPanel;
Label19: TLabel;
Label20: TLabel;
Label21: TLabel;
Label22: TLabel;
Label23: TLabel;
RadioButton7: TRadioButton;
RadioButton8: TRadioButton;
Button3: TButton;
Panel6: TPanel;
Label1: TLabel;
BitBtn1: TBitBtn;
Label15: TLabel;
procedure WWod_koef(Sender: TObject);
procedure W_Rezultat(Sender: TObject);
procedure W_tabliza_A(Sender: TObject);
procedure W_tabliza_B(Sender: TObject);
private
{ Private declarations }
public
{ Public declarations }
end;
var
form1: Tform1;
C_B,C_A:array [1..10,1..10] of integer; { платёжная матрица
игрока А,В}
a_b,a_m,b_b,b_m:array[1..10] of integer; {наибольший наименьший
выигрыш иг. А,В}
al:array[1..10] of real; {массив
альфа}
V_A,V_B:array[1..10,1..10]of real; {Расчётные выигрыши иг.
А,В }
max_a:real; { Наибольший выигрыш игрока А}
max_b:real; { Наибольший выигрыш игрока В}
H_a:integer; { Оптимальная стратегия игрока А}
h_b:integer; { Оптимальная стратегия игрока В}
m:Integer; { Количество стратегий игрока А}
n:Integer; { Количество стратегий игрока В}
k:Integer; { Количество статистических
коэффициентов}
I,J:Integer;
implementation
uses Unit2;
{$R *.DFM}
{ вывод коэф., матрицы С_А}
procedure WW_A;
begin
form1.c_s.Colcount:=n+1;
form1.c_s.Rowcount:=m+1;
form1.tabliza.
| | скачать работу |
Метод Гурвица |