Главная    Почта    Новости    Каталог    Одноклассники    Погода    Работа    Игры     Рефераты     Карты
  
по Казнету new!
по каталогу
в рефератах

Микропроцессоры

. Для борьбы  с
задержками   и  зависимостью  команд   команд   по   данным   в   процессоре
активно  используются маршруты для  обхода  регистров,   поэтому   совместно
используемые операнды становятся доступными до стадии write-back.


      Компания Digital продвигает Альфу как платформу  для  серверов Windows
NT, а не как традиционный UNIX-сервер.



                           4.7.  Процессоры Mips.



      Mips процессор R1000 унаследовал свой суперскалярный  дизайн от R8000,
который предназначался для рынка суперкомпьютеров  научного  назначения.  Hо
R1000 ориентирован на массовые задачи. Использование в  R1000  динамического
планирования команд, которое ослабляет  зависимость  от  перекомпиляции  ПО,
написанного для более старых процессоров, стало возможным  благодаря  тесным
связям Mips со своим партнером Silicon Graphics, имеющим  богатейший  тыл  в
виде  сложных  графических приложений.


      R1000 первый однокристалльный процессор от  Mips.  Для  предотвращения
остановок  конвейера  в   нем   использовано    динамическое    предсказание
переходов, с  четырьмя  уровнями  условного  исполнения,  с   использованием
переименования   регистров,   гарантирующего   что   результаты   не   будут
передаваться в реальные регистры до тех  пор,  пока   неясность  по  команде
перехода  не   будет   снята.   Процессор   поддерживает   «теневую   карту»
отображения   своих   регистров   переименования.    В    случае   неверного
предсказания  адреса  перехода   он   просто   восстанавливает   эту   карту
отображения, но не выполняет фактической  очистки   регистров  и  «промывки»
буферов, экономя таким образом один такт.


      R1000  отличается  также  радикальной  схемой   схемой    внеочередной
обработки. Порядок следования команд  в  точном  соответствии  с  программой
сохраняется  на  трех  первых   ступенях   конвейера,    но    затем   поток
разветвляется  на  три  очереди  (где  команды  дожидаются    обработки   на
целочисленном  АЛУ,  блоке  вычислений   с   плавающей   точкой   и    блоке
загрузки/записи). Эти очереди уже обслуживаются по мере   освобождения  того
или иного ресурса.


      Предполагаемая  производительность   R1000,   выполненного   по  КМОП-
технологии  с  нормами  0.35  микрон  должна  достичь  300   по SPECint92  и
по SPECfp92.


      Программный порядок в конце  концов  восстанавливается  так, что самая
«старая»  команда   покидает   обработку   первой.    Аппаратная   поддержка
исполнения  в  стиле  out-of-order  дает  большие   преимущества   конечному
пользователю, так как коды,  написанные  под  старые   скалярные  процессоры
Mips (например, R4000), начинают работать  на  полной скорости и не  требуют
перекомпиляции.  Хотя  потенциально  процессор R1000  способен  выдавать  по
пять команд на исполнение в каждом такте, он выбирает  и  возвращает  только
четыре, не успевая закончить пятую в том же такте.


      Одно из двух устройств для  вычисления  двойной  точности  с плавающей
точкой занято  сложениями,  а  другое  умножениями/делениями  и  извлечением
квадратного корня. Hа кристалле R1000  реализован  также  интерфейс  внешней
шины,  позволяющий  связывать  в  кластер   до   четырех   процессоров   без
дополнительной логики обрамления.



                      4.8.  Процессоры Hewlett-Packard.



      Hewlett-Packard процессор PA-8000. Компания  Hewlett-Packard одной  из
первых освоила RISC-технологию, выйдя еще в  1986  году  со своим первым 32-
разрядным процессором PA-RISC. Практически  все  выпускаемые процессоры  PA-
RISC используются в рабочих станциях HP  серии 9000.  В  период  с  1991  по
1993 (перед появлением систем  на  базе  PowerPC)  HP  отгрузила  достаточно
много таких  машин,  став   крупнейшим  продавцом  RISC-чипов  в  долларовом
выражении.


      С   целью   пропаганды    своих    микропроцессоров    среди    других
производителей  систем  компания  HP   стала    организатором    организации
Precision RISC Organization (PRO). А в 1994 году  компания  взорвала  бомбу,
объединившись с Intel для  создания  новой  архитектуры.  Это поставило  под
сомнение будущее PRO.


      PA-8000 это  64-разрядный,  четырехканальный  суперскалярный процессор
с  радикальной  схемой  неупорядоченного  исполнения  программ.   В  составе
кристалла десять функциональных блоков,  включая   два  целочисленных   АЛУ,
два  блока  для  сдвига   целых   чисел,   два    блока  multiply/accumulate
(MAC)  для  чисел  с  плавающей  запятой,   два   блока   деления/извлечения
квадратного  корня   для   чисел   с   плавающей   запятой   и   два   блока
загрузки/записи. Блоки  МАС  имеют  трехтактовую   задержку   и  при  полной
загрузке   конвейера   на   обработке   одинарной   точности    обеспечивают
производительность 4 FLOPS  за   такт.   Блоки   деления   дают  17-тактовую
задержку и не конвейеризированы, но  они   могут   работать  одновременно  с
блоками МАС.


      В PA-8000 использован буфер переупорядочивания команд  (IRB)  глубиной
56 команд, позволяющий  «просматривать»программу  на   следующие  56  команд
вперед  в  поисках  таких  четырех   команд,    которые    можно   выполнить
параллельно.  IRB фактически состоит из  двух   28-слотовых  буферов.  Буфер
АЛУ содержит команды для целочисленного блока и  блока  плавающей  точки,  а
буфер памяти - команды загрузки/записи.


      Как только команда попадает в слот IRB, аппаратура  просматривает  все
команды, отправленные на функциональные блоки, чтобы найти среди них  такую,
которая является источником операндов  для  команды,  находящейся  в  слоте.
Команда в слоте  запускается  только  после того, как будет распределена  на
исполнение последняя команда,  которая сдерживала ее. Каждый из буферов  IRB
может выдавать по  две  команды в каждом такте, и в  любом  случае  выдается
самая   «старая»    команда   в   буфере.   Поскольку   PA-8000   использует
переименование  регистров и возвращает результаты выполнения команд  из  IRB
в  порядке  их следования по  программе,  тем  самым  поддерживается  точная
модель  обработки исключительных ситуаций.


      HP проектировала РА-8000  специально для задач  коммерческой обработки
данных и сложных вычислений, типа генной инженерии, в  которых объем  данных
настолько  велик,  что  они  не  умещаются   ни    в    один   из   мыслимых
внутрикристалльных  кэшей.  Вот  почему,  РА-8000  полагается   на   внешние
первичные кэши  команд  и  данных.  Слоты  в  третьем  28-слото-вом  буфере,
который называется  буфером   переупорядочивания   адресов  (Adress-Recorder
Buffer - ARB), один к одному ассоциированы со  слотами в буфере памяти  IRB.
В АРВ содержатся виртуальные  и   физические  адреса  всех  выданных  команд
загрузки/записи. Кроме того, АРВ  допускает выполнение загрузок и записей  в
произвольном  порядке,  но  с  сохранением  согласованности  и  сглаживанием
влияния задержки,  связанной с адресацией внешних кэшей.



                         4.9.  Процессоры Motorola.



      Motorola/IBM процессор PowerPC620  это  первая  64-битовая  реализация
архитектуры PowerPC. Имея  64-битовые  регистры   и   внутренние  магистрали
данных и семь миллионов транзисторов,  новому   процессору  требуется  почти
вдвое больший и сложный кристалл, чем  у  PowerPC  604.   Модель  620  имеет
четырехканальную  суперконвейерную    схему    с    шестью   исполнительными
устройствами:  три  целочисленных   АЛУ,   блок    плавающей   точки,   блок
загрузки/записи и блок переходов. Последний  способен   на  четырехуровневое
предсказание ветвлений в программе и  условное  исполнение с  использованием
схемы переименования регистров.


      ПО микроархитектуре RISC-ядра 620-й похож на 604-й.  Отличия  сводятся
в основном к ширине регистров и магистралей данных, а  также к  увеличенному
числу станций резервирования  для  условного   исполнения  команд.  Прибавка
производительности достигнута  за   счет   улучшенного  шинного  интерфейса.
Теперь он имеет 128-битовый интерфейс  к памяти, по которому  за  один  цикл
обращения можно выбрать два  64-би-товых длинных слова,  и  40-битовая  шина
адреса, по которой можно  адресовать до одного терабайта физической памяти.


      В  состав  шинного  интерфейса  входить  также  поддержка   кэш-памяти
второго уровня объемом до 128 Мбайт, которая может  работать   на  четверти,
половине или на полной скорости ЦПУ.



                          6. Сравнительный анализ.



      В середины октября 1995  года  в  г.Сан-Хосе  (Калифорния)   состоялся
очередной Микропроцессорный Форум. В прошлом году на нем   демонстрировались
прототипы процессоров IBM Power PC 620, MIPS R10000, SUN UltraSPARC, HP  PA-
8000 и DEC Alpha 21164.


      Из прошлогодних процессоров-дебюторов до рынка дошел  только процессор
Alpha 21164/300. Его производительность по  тесту  SPECint92  составила  341
единицу.  Пребывая  с  такой   потрясающей   производительностью  в  лидерах
гонки на быстродействие процессоров,   в   ноябре  Alpha  пропустила  вперед
компанию Intel с  процессором  Pentium  Pro.  Страсти накалились  нешуточные
и вот на нынешнем  форуме  Digital  сообщила,  что  в  декабре  приступит  к
выпуску нового варианта  этого  процессора - Alpha 21164A с тактовой  частой
333   МГц,   выполненного   по   технологии    0.35    мкм.    Проектируемая
производительность  500    по SPECint92.


      Hewlett-Packard анонсировала  32-разрядный  процессор  архитектуры  РА
следующего  поколения  РА-7300LC   с   встроенными   функциями  мультимедиа.
Hачало его выпуска по 0.5 мкм   технологии   возможно   во  второй  половине
следующего года. Этот первый процессор PA-RISC,  оснащенный  внутренними  64
Кбайт кэшами первого уровня для команд и для данных,  предпочтительно  будет
иметь 200 SPECint92 и 275 SPECfp92.


      Через  год  после  объя
Пред.678910
скачать работу

Микропроцессоры

 

Отправка СМС бесплатно

На правах рекламы


ZERO.kz
 
Модератор сайта RESURS.KZ