Главная    Почта    Новости    Каталог    Одноклассники    Погода    Работа    Игры     Рефераты     Карты
  
по Казнету new!
по каталогу
в рефератах

Кластерные системы

рудования без нарушения работоспособности всего кластера.


                                    [pic]
                                    рис.3
В   качестве   вычислительных   узлов   в   кластере   обычно   используются
однопроцессорные персональные компьютеры, двух- или четырехпроцессорные SMP-
серверы. Каждый узел  работает  под  управлением  своей  копии  операционной
системы,  в   качестве   которой   чаще   всего   используются   стандартные
операционные системы: Linux, NT, Solaris и  т.п.  Состав  и  мощность  узлов
может меняться даже в рамках одного кластера,  давая  возможность  создавать
неоднородные системы. Выбор конкретной коммуникационной  среды  определяется
многими  факторами:  особенностями  класса  решаемых  задач,  необходимостью
последующего расширения кластера и т.п. Возможно  включение  в  конфигурацию
специализированных компьютеров,  например,  файл-сервера,  и,  как  правило,
предоставлена возможность удаленного доступа на кластер через Internet.
Из определения архитектуры кластерных систем следует,  что  она  включает  в
себя очень широкий спектр  систем.  Рассматривая  крайние  точки,  кластером
можно  считать  как  пару  ПК,  связанных  локальной   10-мегабитной   сетью
Ethernet, так и вычислительную систему, создаваемую в рамках проекта  Cplant
в Национальной лаборатории Sandia: 1400 рабочих станций на базе  процессоров
Alpha, связанных высокоскоростной сетью Myrinet.
Таким образом видно, что  различных  вариантов  построения  кластеров  очень
много. При этом в архитектуре кластера большое значение  имеют  используемые
коммуникационные технологии и  стандарты.  Они  во  многом  определяют  круг
задач, для решения  которых  можно  использовать  кластеры,  построенные  на
основе этих технологий.

Коммуникационные технологии построения кластеров

Кластеры могут стоится как  на  основе  специализированных  высокоскоростных
шин передачи данных, так и на  основе  массовых  сетевых  технологий.  Среди
массовых коммуникационных стандартов сейчас  чаще  всего  используется  сеть
Ethernet  или  более  ее  производительный  вариант  -  Fast  Ethernet,  как
правило, на базе коммутаторов. Однако большие накладные расходы на  передачу
сообщений в рамках  Fast  Ethernet  приводят  к  серьезным  ограничениям  на
спектр задач, которые можно эффективно решать на  таком  кластере.  Если  от
кластера  требуется  большая  производительность   и   универсальность,   то
необходимо применять более скоростные  и  специализированные  технологии.  К
ним  относятся  SCI,  Myrinet,   cLAN,   ServerNet   и   др.   Сравнительная
характеристика параметров этих технологий приведена в

таблице 1.

|                  |SCI     |Myrinet |CLAN    |ServerNe|Fast       |
|                  |        |        |        |t       |Ethernet   |
|Латентность (MPI) |5,6 мкс |17 мкс  |30 мкс  |13 мкс  |170 мкс    |
|Пропускная        |80      |40      |100Мбайт|180     |10 Мбайт/c |
|способность(MPI)  |Мбайт/c |Мбайт/c |/c      |Мбайт/c |           |
|Пропускная        |400     |160     |150     |н/д     |12,5       |
|способность       |Мбайт/c |Мбайт/c |Мбайт/c |        |Мбайт/c    |
|(аппаратная)      |        |        |        |        |           |
|Реализация MPI    |ScaMPI  |HPVM,   |MPI/Pro |MVICH   |MPICH      |
|                  |        |MPICH-GM|        |        |           |
|                  |        |и др.   |        |        |           |


                                 Таблица 1.

Производительность   коммуникационных   сетей    в    кластерных    системах
определяется несколькими числовыми характеристиками. Основных  характеристик
две:  латентность  –  время  начальной  задержки  при  посылке  сообщений  и
пропускная способность сети, определяющая скорость  передачи  информации  по
каналам связи. При этом важны не столько пиковые характеристики,  заявленные
в  стандарте,  сколько  реальные,  достигаемые  на  уровне  пользовательских
приложений, например, на уровне MPI-приложений. В  частности,  после  вызова
пользователем функции посылки  сообщения  Send()  сообщение  последовательно
пройдет через целый  набор  слоев,  определяемых  особенностями  организации
программного обеспечения и аппаратуры,  прежде,  чем  покинуть  процессор  –
поэтому существует существенный разбром по стандартам значений  латентности.
Наличие латентности приводит к тому, что максимальная скорость  передачи  по
сети не может быть достигнута на сообщениях с небольшой длиной.
Скорость передачи данных  по  сети  в  рамках  технологий  Fast  Ethernet  и
Scalable Coherent Interface (SCI)  зависит  от  длины  сообщения.  Для  Fast
Ethernet характерна большая величина латентности – 160-180 мкс, в  то  время
как латентность для SCI это величина около 5,6  мкс.  Максимальная  скорость
передачи для этих же технологий 10 Мбайт/c и 80 Мбайт/с соответственно.


Цели создания кластерных систем

Разработчики архитектур кластерных систем приследовали  различные  цели  при
их создании. Первой была  фирма  Digital  Equipment  с  кластерами  VAX/VMS.
Целью  создания  этой  машины  было  повышение  надежности  работы  системы,
обеспечение высокой готовности и  отказоустойчивости  системы.  В  настоящее
время существует множество  аналогичных  по  архитектуре  систем  от  других
производителей.
Другой  целью  создания   кластерных  систем   является   создание   дешевых
высокопроизводительных параллельных вычислительных систем.  Один  из  первых
проектов, давший имя целому классу параллельных  систем  –  кластер  Beowulf
[2] – возник в  центре  NASA  Goddard  Space  Flight  Center  для  поддержки
необходимыми вычислительными ресурсами проекта  Earth  and  Space  Sciences.
Проект Beowulf начался летом 1994 года, и вскоре был собран  16-процессорный
кластер  на  процессорах  Intel  486DX4/100  МГц.  На   каждом   узле   было
установлено по  16  Мбайт  оперативной  памяти  и  по  3  сетевых  Ethernet-
адаптера.   Эта   система   оказалась    очень    удачной    по    отношению
цена/производительность,  поэтому  такую  архитектуру   стали  развивать   и
широко использовать в других научных организациях и институтах.
Для каждого  класса  кластеров  характерны  свои  особенности  архитекуры  и
применяемые аппаратные средства. Рассмотрим их более подробно.

Отказоустойчивые кластеры


Принципы построения

Для  обеспечения  надежности  и  отказоустойчивости  вычислительных   систем
применяется  множество  различных  аппаратурных   и   программных   решений.
Например, в системе может дублироваться все подверженные отказам элементы  —
источники  питания,  процессоры,  оперативная  и   внешняя   память.   Такие
отказоустойчивые  системы  с  резервированием  компонентов  применяются  для
решения задач, в  которых  недостаточно  надежности  обычных  вычислительных
систем, оцениваемой в настоящий момент вероятностью безотказной работы  99%.
В таких задачах требуется  вероятность  99,999%  и  выше.  Такую  надежность
можно достичь  применяя  отличные  от  приведенного  выше  методы  повышения
отказоустойчивости.  В  зависимости  от  уровня  готовности   вычислительной
системы к использованию выделяют четыре типа надежности:

|Уровень готовности,|Мaкс. время  |Тип системы                     |
|%                  |простоя      |                                |
|99,0               |3,5 дня в год|Обычная (Conventional)          |
|99,9               |8,5 часов в  |Высокая надежность (High        |
|                   |год          |Availability)                   |
|99,99              |1 час в год  |Отказоустойчивая (Fault         |
|                   |             |Resilient)                      |
|99,999             |5 минут в год|Безотказная (Fault Tolerant)    |


                                 Таблица 2.

В отличие от отказоустойчивых систем с  избыточными  компонентами,  а  также
различных вариантов многопроцессорности,  кластеры  объединяют  относительно
независимые друг от друга машины, каждую из  которых  можно  остановить  для
профилактики или реконфигурирования, не нарушая при  этом  работоспособности
кластера в целом. Высокая производительность кластера и сведение к  минимуму
времени простоев приложений достигается благодаря тому, что:
в случае сбоя ПО на одном из  узлов  приложение  продолжает  функционировать
или автоматически перезапускается на других узлах кластера;
выход из строя одного из узлов (или нескольких) не  приведет  к  краху  всей
кластерной системы;
профилактические  и  ремонтные  работы,  реконфигурацию  или  смену   версий
программного обеспечения, как правило, можно осуществлять в  узлах  кластера
поочередно, не прерывая работы других узлов.
Неотъемлемой частью кластера является специальное  программное  обеспечение,
которое, собственно, и решает проблему восстановления узла в случае сбоя,  а
также решает другие задачи. Кластерное ПО  обычно  имеет  несколько  заранее
заданных сценариев восстановления работоспособности системы, а  также  может
предоставлять  администратору   возможности   настройки   таких   сценариев.
Восстановление после сбоев может поддерживаться как для узла в целом, так  и
для отдельных его компонентов  —  приложений,  дисковых  томов  и  т.д.  Эта
функция автоматически инициируется в случае системного сбоя, а  также  может
быть запущена администратором,  если  ему,  например,  необходимо  отключить
один из узлов для реконфигурации.
Кластеры могут иметь разделяемую память на внешних дисках, как  правило,  на
дисковом массиве RAID. Дисковый  массив  RAID  —  это  серверная  подсистема
ввода-  вывода  для  хранения  данных  большого  объема.  В  массивах   RAID
значительное  число  дисков  относительно  малой  емкости  используется  для
хранения крупных объемов данных,  а  также  для  обеспечения  более  высокой
надежности и избыточности. Подобный массив  воспринимается  компьютером  как
единое логическое устрой
12345След.
скачать работу

Кластерные системы

 

Отправка СМС бесплатно

На правах рекламы


ZERO.kz
 
Модератор сайта RESURS.KZ