Главная    Почта    Новости    Каталог    Одноклассники    Погода    Работа    Игры     Рефераты     Карты
  
по Казнету new!
по каталогу
в рефератах

Принципы проектирования и использования многомерных баз данных

 обновлению  данных
могут  быть  спланированы  заранее.  Поэтому  в  таких  системах  обычно  не
требуются  и,  соответственно,  не  предусматриваются,  например,   развитые
средства  обеспечения  целостности,  восстановления  и  устранения  взаимных
блокировок и т.д. А это не только  существенно  облегчает  и  упрощает  сами
средства реализации, но и значительно снижает внутренние  накладные  расходы
и, следовательно, повышает производительность  при  выполнении  их  основной
целевой функции - поиске и выборке данных.



|Характеристика     |Оперативные                  |Аналитические                |
|Частота обновления |Высокая частота, маленькими  |Малая частота, большими      |
|                   |порциями                     |порциями                     |
|Источники данных   |В основном внутренние        |В основном внешние (по       |
|                   |                             |отношению к аналитической    |
|                   |                             |системе)                     |
|Возраст данных     |Текущие (за период от        |В основном исторические (за  |
|                   |нескольких месяцев до одного |период в несколько лет,      |
|                   |года)                        |десятки лет) и прогнозируемые|
|Уровень агрегации  |Детализированные данные      |В основном агрегированные    |
|данных             |                             |данные                       |
|Назначение         |Фиксация, оперативный поиск и|Работа с историческими       |
|                   |обработка данных             |данными, аналитическая       |
|                   |                             |обработка, прогнозирование и |
|                   |                             |моделирование                |


  Таблица  3.  (Характеристики  данных  в  системах,   ориентированных   на
оперативную и аналитическую обработку данных).



  Многомерная модель данных

  "Многомерный взгляд  на  данные  наиболее  характерен  для  пользователя,
занимающегося анализом данных" - это утверждение  сегодня  стало  уже  почти
аксиомой. Однако, что такое  многомерное  представление,  откуда  появляется
многомерность в  трехмерном  мире,  чем  оно  отличается  и  чем  оно  лучше
ставшего уже привычным реляционного представления? И наконец,  откуда  среди
нас появились люди, мыслящие в четырех и более  измерениях,  и  как  это  им
удается -  именно  эти  вопросы  возникают  практически  у  любого,  впервые
прочитавшего это утверждение.

  На самом деле все  сказанное  в  этом  утверждении  -  чистая  правда,  и
пользователю, занимающемуся анализом,  действительно  присуща  многомерность
мышления. Весь вопрос в том, что понимать под Измерением.

  Двухмерное представление данных конечному пользователю

  Достаточно  очевидно,  что  даже  при  небольших  объемах  данных  отчет,
представленный в виде двухмерной таблицы  (Модели  автомобиля  по  оси  Y  и
Время по оси X), нагляднее и информативнее отчета с  реляционной  построчной
формой организации (рис. 1).

  Реляционная модель



|Модель      |Месяц                    |Объем                  |
|"Жигули"    |Июнь                     |12                     |
|"Жигули"    |Июль                     |24                     |
|"Жигули"    |Август                   |5                      |
|"Москвич"   |Июнь                     |2                      |
|"Москвич"   |Июль                     |18                     |
|"Волга"     |Июль                     |19                     |


  Многомерная модель



|                   |Июнь               |Июль               |Август             |
|"Жигули"           |12                 |24                 |5                  |
|"Москвич"          |2                  |18                 |No                 |
|"Волга"            |No                 |19                 |No                 |


  Рисунок 1. (Реляционная и многомерная модели представления данных).



  А теперь представим, что у нас не три  модели,  а  30  и  не  три,  а  12
различных месяцев. В  случае  построчного  (реляционного)  представления  мы
получим отчет в 360 строк (30х12), который займет не менее  5-6  страниц.  В
случае  же  многомерного  (в  нашем  случае  двухмерного)  представления  мы
получим достаточно компактную таблицу 12 на 30, которая вполне уместится  на
одной странице и которую,  даже  при  таком  объеме  данных,  можно  реально
оценивать и анализировать.



  И  когда  говорится  о   многомерной   организации   данных,   вовсе   не
подразумевается  то,  что  данные  представляются   конечному   пользователю
(визуализируются) в виде четырех или пятимерных гиперкубов. Это  невозможно,
да и пользователю  более  привычно  и  комфортно  иметь  дело  с  двухмерным
табличным представлением и двухмерной бизнес-графикой.



  Закономерен вопрос: "Где же здесь многомерность,  откуда  она  берется  и
куда исчезает?" Ответ прост. Когда  говорится  о  многомерности,  имеется  в
виду  не  многомерность  визуализации,  а  многомерное   представление   при
описании структур данных и поддержка многомерности в языках  манипулирования
данными.



  Многомерное представление при описании структур данных

  Основными понятиями, с которыми оперирует пользователь и проектировщик  в
многомерной модели данных, являются:

   . измерение (Dimension);

   . ячейка (Cell).



  Иногда  вместо  термина   "Ячейка"   используется   термин   "Показатель"
(Measure).



  Измерение - это множество однотипных данных, образующих  одну  из  граней
гиперкуба. Например - Дни, Месяцы,  Кварталы,  Годы  -  это  наиболее  часто
используемые  в  анализе  временные  Измерения.   Примерами   географических
измерений являются: Города, Районы, Регионы, Страны и т.д.



  В многомерной модели данных Измерения играют роль индексов,  используемых
для идентификации конкретных значений (Показателей), находящихся  в  Ячейках
гиперкуба.



  В свою  очередь,  Показатель  -  это  поле  (обычно  цифровое),  значения
которого  однозначно  определяются  фиксированным   набором   Измерений.   В
зависимости от того, как формируются его  значения,  Показатель  может  быть
определен, как:

   . Переменная (Variable) - значения таких Показателей один  раз  вводятся
     из какого-либо внешнего источника или формируются программно и затем в
     явном виде хранятся в многомерной базе данных (МБД);

   .  Формула  (Formula)  -  значения  таких  Показателей  вычисляются   по
     некоторой заранее специфицированной формуле. То есть  для  Показателя,
     имеющего тип Формула, в БД хранится не его  значения,  а  формула,  по
     которой эти значения могут быть вычислены.

  Заметим, что это различие существует только  на  этапе  проектирования  и
полностью скрыто от конечных пользователей.

  В примере  на  рис.  1  каждое  значение  поля  Объем  продаж  однозначно
определяется комбинацией полей:

  Модель автомобиля;

  Месяц продаж.



  Но в реальной ситуации для однозначной идентификации значения Показателя,
скорее всего, потребуется большее число измерений, например:

  Модель автомобиля;

  Менеджер;

  Время (например Год).

  Измерения:

      Время (Год) - 1994, 1995, 1995

      Менеджер - Петров, Смирнов, Яковлев

  Показатель:

      Объем Продаж



  И в терминах многомерной модели речь  будет  идти  уже  не  о  двухмерной
таблице, а о трехмерном гиперкубе:

  первое Измерение - Модель автомобиля;

  второе Измерение - Менеджер, продавший автомобиль;

  третье Измерение - Время (Год);

  на  пересечении  граней  которого  находятся  значения  Показателя  Объем
продаж.



  Заметим, что, в отличие от Измерений, не все значения Показателей  должны
иметь и имеют реальные значения. Например, Менеджер Петров  в  1994  г.  мог
еще не работать в фирме, и в  этом  случае  все  значения  Показателя  Объем
продаж за этот год будут иметь неопределенные значения.



  Гиперкубические и поликубические модели данных

  В различных МСУБД используются два основных варианта организации данных:

   . Гиперкубическая модель;

   . Поликубическая модель.



  В чем состоит  разница?  Системы,  поддерживающие  Поликубическую  модель
(примером является Oracle Express Server), предполагают,  что  в  МБД  может
быть  определено  несколько  гиперкубов  с  различной   размерностью   и   с
различными Измерениями в качестве их граней. Например,  значение  Показателя
Рабочее Время Менеджера,  скорее  всего,  не  зависит  от  Измерения  Модель
Автомобиля и однозначно определяется двумя Измерениями: День и  Менеджер.  В
Поликубической модели в этом  случае  может  быть  объявлено  два  различных
гиперкуба:

  Двухмерный - для Показателя Рабочее Время Менеджера;

  Трехмерный - для Показателя Объем Продаж.



  В случае же Гиперкубической модели  предполагается,  что  все  Показатели
должны определяться одним и тем же набором Измерений. То есть  только  из-за
того,  что  Объем  Продаж  определяется  тремя  Измерениями,  при   описании
Показателя  Рабочее  Время  Менеджера  придется   также   использовать   три
Измерения  и  вводить  избыточное  для  этого  Показателя  Измерение  Модель
Автомобиля.



  Операции манипулирования Измерениями

  Формирование "Среза".  Пользователя  редко  интересуют  все  потенциально
возможные комбинации значений Измерений. Более того, он практически  никогда
не работает одновременно  сразу  со  всем  гиперкубом  данных.  Подмножество
гиперкуба, получившееся в результате  фиксации  значения  одного  или  более
Измерений, называется Срезом (Slice). Например, если мы  ограничим  значение
Измерения Модель Автомобиля = "ВАЗ2108", то получим  подмножество  гиперкуба
(в нашем случае - двухмерную  таблицу),
12345
скачать работу

Принципы проектирования и использования многомерных баз данных

 

Отправка СМС бесплатно

На правах рекламы


ZERO.kz
 
Модератор сайта RESURS.KZ