Процедуры, выполняемые на этапах жизненного цикла БД:
1) Проектирование(Анализ предметной области и запросов к БД; Интеграция пользовательских представлений; Выбор средств реализации; Логическое проектирование данных; Физическое проектирование)
2) Создание (Генерация схемы БД; Подготовка среды хранения; Первичный ввод и контроль данных; Загрузка и корректировка БД)
3) Эксплуатация(-Организация доступа к данным (Поиск и обновление; Разграничение доступа; Инициирование и завершение работы с СУБД); - Контроль состояния БД (Сбор и анализ статистики использования; Контроль целостности БД; Копирование и восстановление); - Реорганизация БД (Реструктуризация; Реформатизация))
Термин OLAP был предложен в 1993 г. Эдвардом Коддом (E. Codd - автор реляционной модели данных) По Коду OLAP-технология - это технология комплексного динамического синтеза, анализа и консолидации больших объемов многомерных данных. Он же сформулировал 12 принципов OLAP, которые позже были переработано в так называемый тест FASMI: Fast (быстрый) - предоставление пользователю результатов анализа за приемлемое время (обычно не более 5 с), пусть даже ценой менее детального анализа; Analysis (анализ) - возможность осуществления любого логического и статистического анализа, характерного для данного приложения, и его сохранения в доступном для конечного пользователя виде; Shared (разделяемой) - многопользовательский доступ к данным с поддержкой соответствующих механизмов блокировок и средств авторизованного доступа;Multidimensional (многомерной) - многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий (ключевое требование OLAP); Information (информации) - возможность обращаться к любой нужной информации независимо от ее объема и места хранения.
OLAP-технология представляет для анализа данные в виде многомерных (и, следовательно, нереляционных) наборов данных, называемых многомерными кубами (гиперкуб, метакуб, кубом фактов), оси которого содержат параметры, а ячейки - зависящие от них агрегатные данные
При том гиперкуб является концептуальной логической моделью организации данных, а не физической реализацией их хранения, поскольку храниться такие данные могут и в реляционных таблицах ("реляционные БД были, есть и будут наиболее подходящей технологией для хранения корпорационных данных" - E. Codd).
По Кодду, многомерное концептуальное представление представляет собой множественную перспективу, состоящую из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям определяется как многомерный анализ. Осями многомерной системы координат служат основные атрибуты анализируемого бизнес-процесса (то, по чему ведется анализ). Например, для продаж это могут быть тип товара, регион, тип покупателя. В качестве одного из измерений используется время. На пересечениях осей - измерений (dimensions) - находятся данные, количественно характеризующие процесс - меры (measures): суммы и иные агрегатные функции (min, max, avg, дисперсия, ср. отклонение и пр.). Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения (уровней иерархии), где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению (различные уровни их детализации). В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений.Благодаря такой модели данных пользователи могут формулировать сложные запросы, генерировать отчеты, получать подмножества данных.
Аналитические OLAP-операции: Сечение. При выполнении операции сечения формируется подмножество гиперкуба, в котором значение одного или более измерений фиксировано (значение параметров для фиксированного, например, месяца).
Вращение (rolling). Операция вращения изменяет порядок представления измерений, обеспечивая представление метакуба в более удобной для восприятия форме. Консолидация (rolling up). Включает такие обобщающие операции, как простое суммирование значений (свертка) или расчет с использованием сложных вычислений, включающих другие связанные данные. Например, показателю для отдельных компаний могут быть просто просуммированы с целью получения показателей для каждого города, а показатели для городов могут быть "свернуты" до показателей по отдельным странам.Операция спуска (drill doun). Операция, обратная консолидации, которая включает отображение подробных сведений для рассматриваемых консолидированных данных. Разбиение с поворотом (slicing and dicing). Позволяет получить представление данных с разных точек зрения. Например, один срез данных о доходах может содержать все сведения о доходах от продаж товаров указанного типа по каждому городу. Другой срез может представлять данные о доходах отдельной компании в каждом из городов. Поддержка многомерной модели данных и выполнение многомерного анализа данных осуществляются отдельным приложением или процессом, называемым OLAP-сервером. Клиентские приложения могут запрашивать требуемое многомерное представление и в ответ получать те или иные данные. При этом OLAP-серверы могут хранить многомерные данные разными способами
2)Моделирование сложных структур средствами реляционной СУБД. Моделирование деревьев с использованием вспомогательной таблицы.
Дерево - иерархия узлов с попарными связями. Корень - самый верхний уровень иерархии, имеющий единственный узел. Каждый узел, кроме корня, связан с одним и только одним узлом находящемся на более высоком уровне по сравнению с ним самим.Имея дело с деревом, могут быть поставлены следующие задачи: найти для каждого узла его предка и потомка найти для конкретного узла его предка и потомка найти для двух конкретных узлов предка и потомка удалить узел в дереве переместить узел объединить деревья вычислить на каком уровне находится некоторый узел Задача моделирования заключается в представлении дерева в виде таблицы.
Существует три базовых способа моделирования иерархий: Рекурсивный, Обход дерева и Использование вспомогательных таблиц.
Использование вспомогательных таблиц. Данный метод напоминает рекурсивный способ, отличие заключается в том, что он хранит узел предок и потомок в отдельных таблицах. Модель дерева строится на основе двух таблиц. Первая таблица (базовая) хранит список всех узлов снабжённых уникальными идентификаторами и всю содержат. информацию по каждому узлу.
Вспомогательная таблица по своей структуре похожа на таблицу со ссылкой на непосредственного предка, но в отличие от неё содержит все полные пути от корневого элемента до каждого узла иерархии в виде наборов пар «родитель-потомок». Здесь потомок может не быть непосредственным (прямым) потомком родителя, поэтому для каждой такой пары указывается расстояние («степень родства») от предка до потомка. Корневые узлы деревьев могут быть обозначены как имеющие в качестве предка самих себя с нулевым расстоянием или, в вариантном исполнении, запись соответствующая корневому узлу дерева может просто отсутствовать во вспомогательной таблице.Первичный ключ во вспомогательной таблице составят все три столбца.
Данная модель позволяет проще, чем в случае рекурсивного метода, но несколько сложнее, чем в случае метода правого и левого коэффициентов (из-за необходимости связывания двух таблиц), выполнять практически все выборки, специфические для иерархий.