Новые технологии в организации PC
ственно имели меньше памяти на плате, и, соответственно,
дешевели.
[pic]
Парадокс в том, что видеокарты все-таки предпочитают иметь БОЛЬШЕ
памяти, и ПОЧТИ НИКТО не хранит текстуры в системной памяти, поскольку
текстур такого объема пока (подчеркиваю - пока) практически нет. При этом в
силу удешевления памяти вообще, карты особенно и не дорожают. Однако
практически все считают, что будущее - за AGP, а бурное развитие
мультимедиа-приложений (в особенности - игр) может скоро привести к тому,
что текстуры перестанут влезать и в системную память. Поэтому имеет смысл,
особо не вдаваясь в технические подробности, рассказать, как же это все
работает.
Итак, начнем с начала, то есть с AGP 1.0. Шина имеет два основных режима
работы: Execute и DMA. В режиме DMA основной памятью является память карты.
Текстуры хранятся в системной памяти, но перед использованием (тот самый
execute) копируются в локальную память карты. Таким образом, AGP действует
в качестве "тыловой структуры", обеспечивающей своевременную "доставку
патронов" (текстур) на передний край (в локальную память). Обмен ведется
большими последовательными пакетами.
В режиме Execute локальная и системная память для видеокарты логически
равноправны. Текстуры не копируются в локальную память, а выбираются
непосредственно из системной. Таким образом, приходится выбирать из памяти
относительно малые случайно расположенные куски. Поскольку системная память
выделяется динамически, блоками по 4К, в этом режиме для обеспечения
приемлемого быстродействия необходимо предусмотреть механизм, отображающий
последовательные адреса на реальные адреса 4-х килобайтных блоков в
системной памяти. Эта нелегкая задача выполняется с использованием
специальной таблицы (Graphic Address Re-mapping Table или GART),
расположенной в памяти.
[pic]
При этом адреса, не попадающие в диапазон GART (GART range), не
изменяются и непосредственно отображаются на системную память или область
памяти устройства (device specific range). На рисунке в качестве такой
области показан локальный фрейм-буфер карты (Local Frame Buffer или LFB).
Точный вид и функционирование GART не определены и зависят от управляющей
логики карты.
Шина AGP полностью поддерживает операции шины PCI, поэтому AGP-траффик
может представлять из себя смесь чередующихся AGP и PCI операций
чтения/записи. Операции шины AGP являются раздельными (split). Это
означает, что запрос на проведение операции отделен от собственно пересылки
данных.
[pic]
Такой подход позволяет AGP-устройству генерировать очередь запросов,
не дожидаясь завершения текущей операции, что также повышает быстродействие
шины.
В 1998 году спецификация шины AGP получила дальнейшее развитие - вышел
Revision 2.0. В результате использования новых низковольтных электрических
спецификаций появилась возможность осуществлять 4 транзакции (пересылки
блока данных) за один 66-мегагерцовый такт (AGP 4x), что означает
пропускную способность шины в 1GB/сек! Единственное, чего не хватает для
полного счастья, так это чтобы устройство могло динамически переключаться
между режимами 1х, 2х и 4х, но с другой стороны, это никому и не нужно.
Однако потребности и запросы в области обработки видеосигналов все
возрастают, и Intel готовит новую спецификацию - AGP Pro (в настоящее время
доступен Revision 0.9) - направленную на удовлетворение потребностей
высокопроизводительных графических станций. Новый стандарт не видоизменяет
шину AGP. Основное направление - увеличение энергоснабжения графических
карт. С этой целью в разъем AGP Pro добавлены новые линии питания.
[pic]
Предполагается, что будет существовать два типа карт AGP Pro - High Power и
Low Power. Карты High Power могут потреблять от 50 до 110W. Естественно,
такие карты нуждаются в хорошем охлаждении. С этой целью спецификация
требует наличия двух свободных слотов PCI с component side (стороны, на
которой размещены основные чипы) карты.
[pic]
При этом данные слоты могут использоваться картой как дополнительные
крепления, для подвода дополнительного питания и даже для обмена по шине
PCI! При этом на использование этих слотов накладываются лишь
незначительные ограничения.
При использовании слотов для подвода дополнительного питания:
Не использовать для питания линии V I/O;
Не устанавливать линию M66EN (контакт 49В) в GND (что вполне естественно,
так как это переводит шину PCI в режим 33 MHz).
При использовании слота для обмена по шине:
Подсистема PCI I/O должна разрабатываться под напряжение 3.3V c
возможностью функционирования при 5 V.
Поддержка 64-разрядного или 66 MHz режимов не требуется.
Карты Low Power могут потреблять 25-50W, поэтому для обеспечения
охлаждения спецификация требует наличия одного свободного слота PCI.
[pic]
При этом все retail-карты AGP Pro должны иметь специальную накладку
шириной соответственно в 3 или 2 слота, при этом карта приобретает вид
достаточно устрашающий.
[pic]
При этом в разъем AGP Pro можно устанавливать и карты AGP.
[pic]
3. Registered DIMM SDRAM
Я думаю, что все знают, что модули оперативной памяти обычного
компьютера вставлена в разьёмы SIMM или DIMM. Есть также ещё пока мало
распространённые RIMM, ну а про RDIMM совсем мало, что слышно.
Для начала надо сказать, что разработчиком памяти стандарта RDIMM
являются IBM и Intel. Модули памяти для RDIMM SDRAM поддерживаются чипсетом
BX, соответсвуют спецификации PC-100 и являются усовершенствованными, а
точнее Регистровыми (Registered) DIMM SDRAM . Основное отличие RDIMM от
обычных DIMM SDRAM заключается в пропускной способности (bandwith): 800 и
1600 Мбайт/сек (последняя цифра особенно нравится, так как первой уже
наступают на пятки мощные 3D-приложения) и называются соответсвенно SDR
(Single Data Rate) и DDR (Dual Data Rate) RDIMM SDRAM. Не путать DDR SDRAM
с DR DRAM (отличается работой на чаcтототе до 800 MHz, выйдет во 2 квартале
и будет дороже за счёт обязательного лицензирования).
Итак, IBM анонсировала модули такой памяти обьёмом 256 Мбайт,
сделанной по технологии 0.20 мкм и имеющие плотность чипов в 4 раза больше,
чем у обычных, что сделало возможным создание буферизированного 256
Мбайтного модуля памяти. Кстати, по заявлению той же IBM нет никаких
преград для увеличения плотности записи в 8 раз выше обычной, а значит,
есть теоритическая возможность создания буферизированных 512 Мбайтных
модулей.
Теперь рассмотрим архитектуру DDR RDIMM SDRAM на примере 64 Мбайтных
модулей. Для осуществления эффективного ввода/вывода данных устанавливаются
конденсаторы (рядом с каждым чипом). Эти конденсаторы сделаны из новейших
диэллектрических материалов. Сама IBM уже применяет модули RDIMM 64-256
Мбайт, а также небуферизированные модули обьемом 512 Мбайт в своих Hi-End
системах серии Netfiniti.
| |SDR RDIMM |DDR RDIMM |
|Время |2, 4, 8 |2, 4, 8 |
|прерывания | | |
|(циклов) | | |
|(Burst | | |
|length ) | | |
|Тип |Последовательное|последовательное чередование |
|прерывания |чередование |(sequential interleave) |
|(Burst |(sequential | |
|type) |interleave) | |
|Число |2, 3, 4 |2, 2.5, 3 |
|тактов для | | |
|работы с | | |
|памятью | | |
|(CAS | | |
|latency) | | |
|Режим |Нормальный, |Нормальный, Режим сброса операций DLL, |
|работы |Режим записи |Режим тестирования (test mode), Режим |
| |(single write), |расширенного регистрирования (Extended |
| |Режим |register mode set), |
| |тестирования |Включение/выключение операций |
| |(test mode) |DLL |
Из таблицы мы видим, что SDR является упрощенным вариантом DDR RDIMM
SDRAM. Особенности DDR заключаются в следующем:
Работа на частоте 125, 133 и 143 MHz за 2, 2,5 и 3 такта (CAS latency = 3),
в зависимости от разновидности модулей
Однотактовое формирование сигнала RAS (Signal-pulsed RAS interface)
Встроенный блок DLL (Delay Locked Loop), который синхронизирует вывод
информации с частотой ее ввода
Возможность отключения блока DLL через функцию расширенного режима
регистрирования (например для экономии питания)
Удвоенная скорость обмена данных (DDR)
Двунаправленный поток данных
Полная синхронизация
Программируемый тип и длина прерываний
Прерывание операций чтения (специальной командой прерывания) и записи.
Смена операций осуществляется последовательно
Четыре банка (Bank) памяти
Способность работы при пониженном потреблении питания
Операции чтения и записи выполняются за 4 и 8 циклов (соответственно),
операция к
| | скачать работу |
Новые технологии в организации PC |