Главная    Почта    Новости    Каталог    Одноклассники    Погода    Работа    Игры     Рефераты     Карты
  
по Казнету new!
по каталогу
в рефератах

Метод Гурвица

ожной фактической информации называется стратегий игрока.
    Главным в исследовании теории игр является выбор оптимальных стратегий
игроков. Стратегия игрока является оптимальной, если применение этой
стратегии обеспечит ему наибольший гарантированный выигрыш при всевозможных
стратегиях другого игрока. В процессе одной игры каждый из игроков выбирает
одну стратеги. Стратегии делятся на чистые и смешанные.
    Чистая стратегия – это стратегия, имеющая одно единственное значение
или решение из множества заданных.
    Смешанная (сложная) стратегия – это стратегия, которая берёт m значений
с соответствующими вероятностями.
    Стороны участвующие в конфликтной ситуации называются игроками, а
предполагаемые действия каждого из игроков, направленные на достижение
некоторой цели, называется правилами игры.
    Платёж – это количественная оценка результатов игры.
    Ходом в теории игр называется выбор одного из предложенных правилами
игры действий его осуществлении.
    Состязательная задача – это задача, разрешающая конфликтные ситуации
между двумя или более противниками с целью нахождения оптимальной стратегии
для каждого игрока, и в конечном итоге игрока, разрешающего конфликтную
ситуацию.
    Игру двух игроков можно описать как производственный процесс с помощью
следующей функциональной схемы (рис.1).
                                                               Рисунок 2.1.1
    Оба игрока по прямой связи U(t) делает ход, выбирая предполагаемую
стратегию. Ни один из игроков не знает хода противника. В случае если игрок
узнает стратегию своего противника, то по обратной связи f(t) поступает
сигнал, что он может отказаться от своей старой стратегии и выбрать другую
стратегию. Востановив работу по прямой связи U(t).
    Человек А в играх с природой старается действовать осмотрительно,
используя, например, минимаксную стратегию, позволяющую получить наименьший
проигрыш. Второй игрок В (природа) действует совершенно случайно, возможные
стратегии определяются как её состояние. Условия игры задаются в виде
матрицы.
    [pic]
    Элементы Сij = выигрышу игрока А, если он использует стратегию Аi.
    В данном курсовом проекте состязательная задача решается по методу
Гурвица.
    Пусть в игре принимают участие два игрока А и В.
    Рассматривается конфликтная ситуация между двумя сторонами А и В. Игрок
А имеет m стратегий, а В имеет n стратегий: А={А1, А1,…, А1}; В={В1, В1,…,
В1}.
    Взаимосвязь между стратегиями любого из игроков определяется платёжной
матрицей С={Cij}m*n. Cij – выигрыш игрока А. Заданы статистические
коэффициенты оптимизации ([pic]).
    Цель игры состоит в том, чтобы вывести ситуацию из условия
неопределённости, найти максимальный выигрыш, по которому определить
оптимальную стратегию каждого игрока, а также игрока разрешающего
конфликтную ситуацию.
    Решение игры и исходные данные сводятся в таблицу Гурвица (табл.
2.1.1).
                                                               Таблица 2.1.1

|      |В1 |В2 |…  |Вn |Наименьший|Наибольший |Коэффициенты        |
|      |   |   |   |   |          |выигрыш    |оптимизма           |
|      |   |   |   |   |выигрыш   |           |                    |
|    |    |    |    |             |             |0,1  |0,2  |0,3  |
|А1  |1   |1   |3   |1            |3            |2,8  |2,6  |2,4  |
|А2  |5   |6   |8   |5            |8            |7,7  |7,4  |7,1  |
|А3  |4   |3   |5   |3            |5            |4,8  |4,6  |4,4  |


    Найти игрока, разрешающего конфликтную ситуацию.
    Найдём условно расчётные выигрыши игрока А по формуле:
    [pic]
    V11=0,1*1+(1 – 0,1)*3=2,8
    V12=0,2*1+(1 – 0,2)*3=2,6
    V13=0,3*1+(1 – 0,3)*3=2,4
    V21=0,1*5+(1 – 0,1)*8=7,7
    V22=0,2*5+(1 – 0,2)*8=7,4
    V23=0,3*5+(1 – 0,3)*8=7,1
    V31=0,1*3+(1 – 0,1)*5=4,8
    V32=0,2*3+(1 – 0,2)*5=4,6
    V33=0,3*3+(1 – 0,3)*5=4,4
    Среди найденных условных расчётных выигрышей найдём максимальный. Он
равен 7.7, значит оптимальная стратегия игрока А будет А2.
    Далее найдём оптимальная стратегия игрока В, для этого транспонируем
матрицу. Результаты заносим в таблицу 2.8.2.

                                                               Таблица 2.8.2


|    |А1  |А2  |А3  |Наименьший   |Наибольший   |Коэффициенты       |
|    |    |    |    |выигрыш      |выигрыш      |оптимизма          |
|    |    |    |    |[pic]        |[pic]        |                   |
|    |    |    |    |             |             |0,1  |0,2  |0,3  |
|В1  |1   |5   |4   |1            |5            |4,6  |4,2  |3,8  |
|В2  |1   |6   |3   |1            |6            |5,5  |5    |4,5  |
|В3  |3   |8   |5   |3            |8            |7,5  |7    |6,5  |


    Найдём условно расчётные выигрыши игрока В
    V11=0,1*1+(1 – 0,1)*5=4,6
    V12=0,2*1+(1 – 0,2)*5=4,2
    V13=0,3*1+(1 – 0,3)*5=3,8
    V21=0,1*1+(1 – 0,1)*6=5,5
    V22=0,2*1+(1 – 0,2)*6=5
    V23=0,3*1+(1 – 0,3)*6=4,5
    V31=0,1*3+(1 – 0,1)*8=7,5
    V32=0,2*3+(1 – 0,2)*8=7
    V33=0,3*3+(1 – 0,3)*8=6,5
    Среди найденных условных расчётных выигрышей найдём максимальный. Он
равен 7.5, значит оптимальная стратегия игрока В будет В3.
    Из 2-х оптимальных стратегий, находим наибольший выигрыш, а именно
7,7>7,5; следовательно игрок А разрешит конфликтную ситуацию с
максимальным выигрышем равным 7,7, стратегия которого равна 2.

2 Оценки результатов решения задачи

    Результат решения задачи полностью соответствует заданию курсового
проекта. В сравнении результатов решения задачи ручным с результатами
автоматизированным методом, получил одинаковые результаты. Что означает что
программа работает верно. Преимущество автоматизированного метода над
ручным состоит в том, что автоматизированное время выполнения программы
меньше, чем ручным.

                                 ЗАКЛЮЧЕНИЕ

    Данная курсовая работа включает в себя два предмета: «Программирование»
и «Компьютерное модулирование»
    В курсовой работе были рассмотрены следующие вопросы:
  . Рассмотрена характеристика «Теории игр» и следующие методы ее решения:
    метод Гурвица, метод Сэвиджа, метод максимина.
  . Рассмотрен и дан алгоритм решения теории игры в условии
    неопределенности методом Гурвица.
  . Дана краткая характеристика ПК, включая анализ средств
    программирования, описания ОС MS-DOS и MS Windows’
  . Рассмотрен выбор языка программирования.
  . Написана программа для решения данной задачи.

                              СПИСОК ЛИТЕРАТУРЫ

 1. Г. С. Малик «Основы экономики и математические методы в планировании».
 2. Кузнецов «Математическое программирование».
 3. В. В. Фаронов «Delphi 5. Учебный курс».
 4. Ю. П. Зайченко «Исследование операций в задачах, алгоритмах,
    программах».

                                                Приложение 1 Текст программы

Medot_Gurwiwiza.dpr

program Medot_Gurwiza;
 {Курсовой проект по предмету "Компьютерное модулирование" по теме "Теория
игр"
  Принцип Гурвица Выполнил студент гр. П-00-1 Юшков Андрей 10.06.02}
uses
  Forms,
  osnowa in 'osnowa.pas' {form1},
  Unit2 in 'Unit2.pas' {Form2};

{$R *.RES}

begin
  Application.Initialize;
  Application.CreateForm(Tform1, form1);
  Application.CreateForm(TForm2, Form2);
  Application.Run;
end.

unit osnowa;

interface

uses
  Windows, Messages, SysUtils, Classes, Graphics, Controls, Forms, Dialogs,
  Grids, StdCtrls, ToolWin, ComCtrls, Buttons, ActnList, StdActns, Menus,
  Mask, ExtCtrls, jpeg;

type
  Tform1 = class(TForm)
    tabliza: TStringGrid;
    Panel1: TPanel;
    Button1: TButton;
    Edit1: TEdit;
    Edit2: TEdit;
    Edit3: TEdit;
    Label2: TLabel;
    Label3: TLabel;
    Label4: TLabel;
    C_S: TStringGrid;
    Panel2: TPanel;
    Label5: TLabel;
    Label6: TLabel;
    Label7: TLabel;
    Label8: TLabel;
    Label9: TLabel;
    Label10: TLabel;
    Label11: TLabel;
    Label12: TLabel;
    Label13: TLabel;
    Label14: TLabel;
    Panel3: TPanel;
    Panel4: TPanel;
    Label17: TLabel;
    Label18: TLabel;
    Panel5: TPanel;
    Label19: TLabel;
    Label20: TLabel;
    Label21: TLabel;
    Label22: TLabel;
    Label23: TLabel;
    RadioButton7: TRadioButton;
    RadioButton8: TRadioButton;
    Button3: TButton;
    Panel6: TPanel;
    Label1: TLabel;
    BitBtn1: TBitBtn;
    Label15: TLabel;
    procedure WWod_koef(Sender: TObject);
    procedure W_Rezultat(Sender: TObject);
    procedure W_tabliza_A(Sender: TObject);
    procedure W_tabliza_B(Sender: TObject);

  private
    { Private declarations }
  public
     { Public declarations }
 end;

var
  form1: Tform1;
          C_B,C_A:array [1..10,1..10] of integer; { платёжная матрица
игрока А,В}
  a_b,a_m,b_b,b_m:array[1..10] of integer;     {наибольший наименьший
выигрыш иг. А,В}
               al:array[1..10] of real;                       {массив
альфа}
          V_A,V_B:array[1..10,1..10]of real;        {Расчётные выигрыши иг.
А,В }
            max_a:real;         { Наибольший выигрыш игрока А}
            max_b:real;         { Наибольший выигрыш игрока В}
              H_a:integer;      { Оптимальная стратегия игрока А}
              h_b:integer;       { Оптимальная стратегия игрока В}
                m:Integer;        { Количество стратегий игрока А}
                n:Integer;         { Количество стратегий игрока В}
                k:Integer;         { Количество статистических
коэффициентов}
              I,J:Integer;

implementation
uses Unit2;
{$R *.DFM}

{ вывод коэф., матрицы С_А}
procedure WW_A;
 begin
  form1.c_s.Colcount:=n+1;
  form1.c_s.Rowcount:=m+1;
  form1.tabliza.
1234
скачать работу

Метод Гурвица

 

Отправка СМС бесплатно

На правах рекламы


ZERO.kz
 
Модератор сайта RESURS.KZ