Главная    Почта    Новости    Каталог    Одноклассники    Погода    Работа    Игры     Рефераты     Карты
  
по Казнету new!
по каталогу
в рефератах

Новые технологии в организации PC

ачит, позволяет выполнять частично  перекрывающиеся  во  времени
обращения чаще.
Позволяет делать конвейерные  выборки  из  памяти,  причем  передача  адреса
может выполняться одновременно с  передачей  данных.  Отсюда  -  возможность
сильного перекрытия запросов к памяти во времени. Контроллер может  передать
в память до 4-х запросов (причем возможно перемежать считывание  и  запись),
которые будут выполнены последовательно.
   Итого, на  практике  контроллер  может  выжать  из  шины  памяти  95%  ее
максимальной теоретической производительности, которая равна  1.6  гигабайта
в  секунду  (800мгц,  два  байта  за  такт).  Правда,  на  сегодня   пиковая
производительность реальных схем - 600 мегабайт в секунду, но это уже  очень
хорошо. А запас в гигабайт в секунду карман  не  тянет.  Не  успеешь  глазом
моргнуть, как новые  процессоры,  интеллектуальные  дисковые  и  графические
контроллеры используют его до корки, и попросят добавки.
Определенной проблемой новой технологии  является  притормаживание  перехода
на  нее  компании  Intel.  Гигант  не  торопится  переключаться  на  RIMM-ы,
объясняя  это  необходимостью  плавного  перехода.   Как   именно   задержка
обеспечивает плавность - мне не совсем ясно,  но,  безусловно,  эволюционные
подходы - неизбежны. Если завтра все начнут  делать  материнские  платы  под
RIMM-s, куда производители денут выпускающиеся мощным потоком DIMM-s и SIMM-
s? Тем не менее, переход на RIMM-ы можно считать предопределенным.
      В  других  областях  -  от  видеоконтроллеров  до  спец-компьютеров  и
встроенных систем RIMM-ы тоже делают первые шаги. К примеру,  TI  и  S3  уже
лицензировали технологию Direct Rambus, а значит, без работы ей не  умереть.

Предполагается, что в персональных компьютерах  Direct  Rambus  RIMMs  будут
применяться в следующем году, к 2000-му году займут порядка 30, а  в  2001-м
и все 50% рынка.
                            6. Transmeta Crusoe.
      Ну вот и наступил тот день, когда оказались сняты покровы секретности,
окружающие  одну  из  самых  таинственных  компаний  последних   пяти   лет,
Transmeta, а также и их детище - процессор  под  кодовым  названием  Crusoe.
Одно из ранних и общепринятых предположений полностью подтвердилось:  Crusoe
действительно   не   является   конкурентом   процессоров   для   настольных
компьютеров от AMD и Intel - он самую малость опоздал с этим,  но  зато  его
возможности по энергосбережению возможно делают его  идеальным  выбором  для
производителей портативных продуктов - от  ноутбуков  до  HPC.  Но  к  этому
моменту мы вернемся чуть позже,  когда  речь  пойдет  о  конкретных  деталях
чипов. А сейчас посмотрим на более фундаментальные вещи, и  первое,  на  что
стоит обратить внимание в данном случае  -  это  технология  Code  Morphing,
позволяющая "на лету" преобразовывать x86 код во внутреннюю  систему  команд
процессора.
      Crusoe относится к разряду VLIW процессоров. То  есть,  в  отличие  от
привычных каждому пользователю PC чипов, работающих с CISC инструкциями,  он
в своей работе опирается на VLIW (very  long  instruction  word),  будучи  в
этом  более  близок  к  таким  продуктам,  как  Merced  или   Elbrus   2000.
(Последнее,  пожалуй,  особенно  справедливо,   если   учесть,   что   глава
Transmeta, Dave Dietzel, в  свое  время  немало  времени  провел  в  Москве,
контактируя с будущими создателями E2K).
      Так вот, вернемся  к  VLIW.  Поскольку  эта  архитектура  несовместима
напрямую с x86,  а  отказываться  от  такого  преимущества,  каким  является
накопленный парк x86 программного обеспечения создателям  Crusoe  совсем  не
хотелось, и был  разработан  промежуточный,  частично  аппаратный,  частично
программный, невидимый для программ слой - Code Morphing, который  во  время
выполнения программы, незаметно для нее  преобразует  ее  x86  инструкции  в
инструкции VLIW.
   Плюсы и минусы такого подхода, по  сравнению  с  традиционным,  очевидны.
Это:
   1.  Возможность  достаточно  радикально  менять   структуру   процессора,
      подгоняя его к тем или иным требованиям - все равно все изменения  его
      архитектуры для программ можно замаскировать на уровне Code Morphing.
   2. Возможность вносить те или иные изменения в уже выпущенные процессоры,
      опять же на уровне преобразования кода.
   3. Очень удобная вещь для работы с различными новыми наборами  инструкций
      - SSE, 3DNow!, и т.д. Была бы лицензия.
   4. Как ни крути, а эмуляция  остается  эмуляцией,  со  всеми  вытекающими
      последствиями в плане производительности.  В  качестве  примера  можно
      посмотреть на душераздирающие  результаты  эмуляции  x86  программ  на
      PowerPC. Но Transmeta неплохо поработала в этом направлении.
Как это все работает?
[pic]
      Для начала надо сказать пару слов о логической  структуре  процессора.
Ядро Crusoe состоит из пяти модулей четырех различных типов: два  блока  для
операций с целыми числами, один для операций числами  с  плавающей  запятой,
один - для операций с памятью, и один - модуль переходов. Соответственно,  и
каждая VLIW инструкция ("молекула", по  терминологии  Transmeta,  длиной  64
или 128 бит) может состоять из четырех  RISC-подобных  операций  этих  типов
("атомов").  Все  атомы  выполняются  параллельно,  каждый   соответствующим
модулем, молекулы идут друг за другом, в строгом соответствии с очередью,  в
отличие от  большинства  сегодняшних  суперскалярных  x86  процессоров,  где
используется механизм внеочередного выполнения  команд  (out-of-order),  это
заметно упрощает внутреннюю структуру  процессора,  позволяя  отказаться  от
некоторых громоздких функциональных модулей (например, декодера  инструкций,
коих в x86 наборе не так уж и мало). Для иллюстрации можно сравнить  площадь
мобильного 0.18  мкм  Coppermine  с  суммарным  объемом  кэша  288  Кбайт  с
площадью TM5400 с суммарным кэшем 384  Кбайт  -  106  квадратных  милиметров
против  73.  Что,  естественно,  напрямую  сказывается  и   на   разнице   в
тепловыделении и энергопотреблении процессоров.
[pic]
      Но вернемся вновь  к  принципу  работы  процессора.  На  вышеописанный
уровень  "молекулы",   по   возможности   максимально   плотно   упакованные
"атомами", попадают с уровня Code Morphing, где в них превращаются  исходные
инструкции (на данный момент речь идет только о x86, но в перспективе  ничто
не мешает сделать версию транслятора  и  для  другого  набора  команд).  Вся
окружающая среда  с  которой  сталкивается  процессор,  начиная  от  BIOS  и
заканчивая операционной системой и программами, контактирует только  с  Code
Morphing, не имея прямого доступа к самому ядру  процессора.  Очень  удобно,
учитывая, что даже уже у двух первых объявленных процессоров  Transmeta  это
самое ядро - разное.
      Одним из методов увеличения производительности такого  нетрадиционного
способа работы, является очень  логичная  система  кэширования.  Каждая  x86
инструкция, будучи оттранслированной один  раз,  сохраняется  в  специальном
кэше,  располагающемся  в  системной  памяти,  и  в   следующий   раз,   при
необходимости ее выполнения, этап трансляции можно пропустить, сразу  достав
из кэша необходимую цепочку молекул. Вдобавок, как обещает  Transmeta,  Code
Morphing  со  временем  еще  и  обучается:  по  мере  выполнения   программ,
оптимизируя их для более быстрого выполнения, обращает внимание на  наиболее
часто выполняемые участки кода, анализирует переходы  в  теле  программы,  и
т.д.
      Первые  процессоры  Transmeta  максимально  ориентированы   на   рынок
мобильных чипов  (что,  впрочем,  не  мешает  компании  уже  поговаривать  о
серверном  процессоре  этой  же  архитектуры!),  соответственно   одним   из
наиболее важных параметров процессора здесь является его  энергопотребление.
И если с младшим из сегодняшних чипов Transmeta,  TM3120,  с  его  92  Кбайт
кэша, особых проблем нет, то в TM5400 компания  встроила  механизм  LongRun,
функционально  подобный  технологии  SpeedStep  от   Intel   -   возможность
изменения тактовой частоты и напряжения на ядре процессора на лету.  Причем,
куда  более  гибко,  чем  это  возможно  в  случае  с  двумя  фиксированными
значениями у SpeedStep.
      Если уж зашла речь  о  конкретных  чипах,  то  давайте  займемся  этим
вопросом более внимательно. Итак, на сегодняшний день объявлены  два  первых
CPU, созданных  по  представленной  Transmeta  технологии.  Первый,  TM3120,
нацелен на  рынок  HPC,  второй,  TM5400  куда  больше  подходит  для  рынка
субноутбуков. Итак, по порядку:
      TM3120. Младший процессор в семействе, с тактовой частотой 333, 366, и
400 МГц. Обладает всего лишь 96 Кбайт разделенного кэша  L1  (64  Кбайт  под
инструкции, 32 Кбайт - под данные). Процессор рассчитан  на  напряжение  1.5
В.
      Содержит стандартные для серии PC-on-a-chip элементы: 66-133 МГц SDRAM
контроллер с 3.3 В интерфейсом, рассчитанный на применение  со  стандартными
для мобильных приложений модулями SO-DIMM. Частота памяти  получается  путем
применения определенного делителя  (от  1/2  до  1/15)  к  тактовой  частоте
процессора. Контроллер шины PCI также обладает стандартным 33  МГц  PCI  2.1
совместимым   интерфейсом,   обеспечивая   полноценную   работу   со   всеми
сегодняшними продуктами, могущими его использовать. Из  поддержки  периферии
надо упомянуть контроллер флэш-памяти -  если  уж  продукт  ориентирован  на
рынок самых маленьких компьютеров, то без этого там никуда.
      Как любой нормальный процессор, предназначенный для работы  с  Windows
(а в список проверенных ОС входят Microsoft Windows 95, Windows 98,  Windows
NT   и   Linux),   TM3120   должен   соответствовать   системе    управления
энергопотреблением ACPI, что он успешно  и  делает,  потребляя  в  системном
состоянии Deep Sleep всего лишь 0.015 Вт. Разумеется, при выполнении  мощных
вычислений энергопотреблен
Пред.678910
скачать работу

Новые технологии в организации PC

 

Отправка СМС бесплатно

На правах рекламы


ZERO.kz
 
Модератор сайта RESURS.KZ