Первыми устройствами позволившими создавать информационные системы стали магнитные ленты и барабаны. Емкость магнитных лент велика, но по своей физической природе они обеспечивают только последовательный доступ к данным. В то же время отношение цены носителя на магнитной ленте к его ёмкости до сих пор остаётся непревзойдённым. Магнитные ленты используются до сих пор в качестве носителей для резервных копий данных.
Жесткие диски. Магнитные диски были впервые реализованы в начале 50-х годов XX в. в исследовательской лаборатории корпорации IBM в Сан Хосе (Калифорния). В феврале 1954 года впервые данные были переписаны с перфокарт на диск. Устройства внешней памяти – последние компьютерные устройства работающие с «механическими» скоростями. Для работы крупных СУБД остаётся собирать отдельные диски в массивы и представлять их как единый быстродействующий диск.
RAID - Redundant Array of Independent (Inexpensive) Disks (избыточный массив независимых (или недорогих) дисков)
JBOD (Just a Bunch of Disks) Работает по принципу "наполнил одно - заполняй другое". То есть происходит простое соединение емкостей двух дисков. Только после заполнения одного винчестера происходит заполнение другого. Примитивный способ склеивания двух дисков в один.
RAID 0 (Stripe). Режим, при использовании которого достигается максимальная производительность. Не обладая избыточностью, делает весь массив максимально зависимым от сбоев. Данные располагаются поочередно на все диски, что повышает скорость чтения и записи. Используется весь объем дисков. Область применения - приложения, требующие высоких скоростей обмена с диском.
Реляционная база данных - это набор отношений, имена которых совпадают с именами схем отношений в схеме БД. На сегодня известно большое число различных серверов баз данных SQL. Остановимся на следующих четырех ведущих серверных СУБД - Oracle8i, IBM DB2, Microsoft SQL Server и Informix - и сравним их в работе на каждом из основных этапов функционирования.
Oracle8i. Пакет Oracle8i, наделенный самым развитым набором функций для работы с языком Java и доступа к данным через Интернет, системой оптимизации одновременного доступа. Единственным недостатком данной СУБД является сложность администрирования, однако все затраты на ее внедрение и освоение в последствии окупятся эффективной и надежной работой. (сложность и дороговизна-спорны). Среди основных свойств СУБД Oracle следует отметить такие, как: Высочайшая надежность. Возможность разбиения крупных баз данных на разделы (large-database partition), что дает возможность эффективно управлять гигантскими гигабайтными базами; Наличие универсальных средств защиты информации; Эффективные методы максимального повышения скорости обработки запросов; Индексация по битовому отображению; Свободные таблицы (в других СУБД все таблицы заполняются сразу при создании); Распараллеливание операций в запросе. Наличие широкого спектра средств разработки, мониторинга и администрирования. Ориентация на интернет технологии.Решения, не уступающие разработкам Oracle можно найти только в DB2 фирмы IBM. Ориентация на интернет технологии - основной девиз современных продуктов Oracle. В этой связи можно отметить пакеты interMedia, обеспечивающее обработку данных в мультимедийных форматах, и Jserver, встроенное средство для работы с языком Java, которое объединяет возможности языка Java с возможностями реляционных баз данных. Компоненты Enterprise JavaBeans представляют собой базовые модули из которых складываются Интернет-приложения на языке Java. Фирма Oracle придерживается принципа, что всеми важными функциями необходимо управлять из единого центра, поэтому предлагаемый модуль interMedia предоставляет в распоряжение пользователей самые передовые возможности для работы с мультимедийными объектами: Очень развитые средства для обработки аудио клипов; Неподвижных изображений; Видеофрагментов; Географических данных (с целым набором функций связанных с определением местонахождения входящих в состав модуля Locator ). В Oracle8i реализуются лучшие на сегодняшний день средства для объектно-ориентированного конструирования баз данных, в том числе табличные структуры, допускающие наследование свойств и методов других табличных объектов БД, что позволят избежать ошибок при построении БД и облегчает их обслуживание. Также необходимо отметить, что разработанная фирмой Oracle система оптимизации одновременного доступа (multiversioning concurrency) является одной из важнейших характеристик архитектуры Oracle (подобная функция есть лишь в СУБД InterBase компании InterBase компании Inprise). Данная функция позволяет исключить ситуацию, когда одному пользователю приходится ждать, пока другой завершит изменения в содержимое баз данных (т.е. в Oracle отсутствуют блокировки на чтение). Эта функция позволяет СУБД Oracle8i выполнять за секунду больше транзакций в расчете на одного пользователя, чем любая другая база данных. По уровню производительности при работе в WEB среде под LINUX Oracle занимает почетное второе место после СУБД MySQL, при этом значительно превосходя все другие СУБД по надежности и безопасности.
СУБД Microsoft SQL Server Важнейшие характеристики данной СУБД - это: простота администрирования, возможность подключения к Web, быстродействие и функциональные возможности механизма сервера СУБД, наличие средств удаленного доступа, В комплект средств административного управления данной СУБД входит целый набор специальных мастеров и средств автоматической настройки параметров конфигурации. Также данная БД оснащена замечательными средствами тиражирования, позволяющими синхронизировать данные ПК с информацией БД и наоборот. Входящий в комплект поставки сервер OLAP дает возможность сохранять и анализировать все имеющиеся у пользователя данные. В принципе данная СУБД представляет собой современную полнофункциональную база данных, которая идеально подходит для малых и средних организаций. Необходимо заметить, что SQL Server уступает другим рассматриваемым СУБД по двум важным показателям: программируемость и средства работы. При разработке клиентских БД приложений на основе языков Java, HTML часто возникает проблема недостаточности программных средств SQL Server и пользоваться этой СУБД будет труднее, чем системами DB2, Informix, Oracle или
объединение звёзд, полносвязная сеть, произвольный граф. Приведение сетевых структур к более простым. Семантические сети.
Сетевая модель организации данных является расширением иерархической модели. В иерархических структурах запись-потомок должна иметь только одного предка - в сетевой структуре данных потомок может иметь любое число предков. В сетевых моделях один и тот же тип записи может быть членом в нескольких групповых отношениях и одновременно быть владельцем в других. В иерархической модели база данных можеть иметь только древовидную структуру. Количество деревьев в БД определяется числом корневых записей. Каждая БД в системе реализует единую модель данных. В качестве основы этой модели принят сетевой принцип организации данных. БД состоит из множества элементарных записей, для их обозначения в предлагаемой модели используется термин "атом". Количество атомов в БД не ограничено, каждому атому в момент его создания выделяется идентификатор, уникальный в рамках этой БД, который является виртуальным адресом атома, остается неизменным в течение всего времени существования атома и используется для выполнения любых операций с атомом (для обращения к нему). Таким образом, в БД реализован механизм единой виртуальной адресации всех элементарных записей данных (атомов). Каждый атом содержит данные (тело атома), которые в общем случае рассматриваются как двоичные данные. Тело атома может иметь произвольный размер, в том числе нулевой (пустое тело). Каждый атом имеет множество ссылок на другие атомы в этой же БД, которые представляют собой виртуальные адреса других атомов. Атом может иметь произвольное количество ссылок на другие атомы, в том числе ни одной. С помощью ссылок реализуется механизм связывания данных. Ссылки являются однонаправленными, то есть: если атом А ссылается на атом Б, то обратное из этого не следует, но и не опровергается
Отличительные особенности иерархической и сетевой моделей: основной единицей обработки в них является запись в сетевой модели данных обработка может быть начата с записи любого типа независимо от её расположения в БД, и от извлеченной записи возможны переходы как к её подчиненным записям, так и к тем, которым она подчинена; при отображении сетевых структур предметной области в иерархической БД необходимо дублирование данных, при этом семантическая целостность автоматически не поддерживается.
В первую очередь необходимо выбрать способ организации физических связей, то есть топологию. Под топологией вычислительной сети понимается конфигурация графа, вершинам которого соответствуют компьютеры сети (иногда и другое оборудование, например концентраторы), а ребрам - физические связи между ними. Компьютеры, подключенные к сети, часто называют станциями или узлами сети.
Заметим, что конфигурация физических связей определяется электрическими соединениями компьютеров между собой и может отличаться от конфигурации логических связей между узлами сети. Логические связи представляют собой маршруты передачи данных между узлами сети и образуются путем соответствующей настройки коммуникационного оборудования.
Выбор топологии электрических связей существенно влияет на многие характеристики сети. Например, наличие резервных связей повышает надежность сети и делает возможным балансирование загрузки отдельных каналов. Простота присоединения новых узлов, свойственная некоторым топологиям, делает сеть легко расширяемой. Экономические соображения часто приводят к выбору топологий, для которых характерна минимальная суммарная длина линий связи. Рассмотрим некоторые, наиболее часто встречающиеся топологии.
Полносвязная топология соответствует сети, в которой каждый компьютер сети связан со всеми остальными. Несмотря на логическую простоту, этот вариант оказывается громоздким и неэффективным. Действительно, каждый компьютер в сети должен иметь большое количество коммуникационных портов, достаточное для связи с каждым из остальных компьютеров сети. Для каждой пары компьютеров должна быть выделена отдельная электрическая линия связи. Полносвязные топологии применяются редко, так как не удовлетворяют ни одному из приведенных выше требований. Чаще этот вид топологии
Наиболее важная задача, решаемая с применением OLTP, - это ввод (с контролем) информации в базу данных и выполнение множество коротких транзакций к базе данных. Кроме этой задачи OLTP можно использовать для поддержки принятия решений. Для этого необходимо сформировать и выполнить запрос, затем на основе запроса создать отчет, проанализировать его и принять решение. Часто в процессе анализа возникают дополнительные вопросы, которые требуют создания новых запросов и отчетов. В результате процесс анализа был малоэффективен.
Иногда разработчики выбирали работу с двумя базами: ввод данных происходил в одну базу данных, затем после завершения этого процесса прошедшие все необходимые виды контроля данные переносились во вторую базу данных, структура которой выбиралась для оптимизации аналитической обработки. Причем, необходимость во второй базе данных была тем выше, чем сложнее были запросы к данным при аналитической обработке.
Эта схема – с двумя базами данных, для работы с которыми используется одна СУБД, применяется и в настоящее время. Естественным шагом в развитии схемы с двумя базами данных является использование для работы со второй базой специализированной технологии (и продуктов, которые ее реализуют). Наибольшее признание к настоящему времени в качестве такой технологии получила OLAP-технология.
2)Предложение SELECT языка SQL. Сортировка (ORDER BY). Группирование данных (GROUP BY, GROUP BY … HAVING).
ORDER BY
SELECT Company, OrderNumber FROM Orders ORDER BY Company;
SELECT Company, OrderNumber FROM Orders ORDER BY Company, OrderNumber
SELECT Company, OrderNumber FROM Orders ORDER BY Company DESC;
(DESC означает в обратном порядке)
SELECT store_name, Sales, Date FROM Store_Information ORDER BY 2 DESC – По второму столбцу
ГРУППИРОВАНИЕ - GROUP BY
SELECT column, SUM(column) FROM table GROUP BY column
SELECT Company,SUM(Amount) FROM Sales GROUP BY Company;
Иерархические Под иерархической моделью данных понимается модель, объединяющая записи, хранимые в общей древовидной структуре с одним корневым типом записи, который имеет несколько подчиненных типов записи или не имеет совсем. Каждый подчиненный тип записи также может иметь несколько подчиненных типов или не иметь их совсем. Основной структурой, поддерживающей иерархическое представление информации, является дерево Достоинствами иерархической модели данных относятся эффективное использование памяти ЭВМ и неплохие показатели времени выполнения основных операций над данными. Иерархическая модель данных удобна для работы с иерархически упорядоченной информацией. Недостатком иерархической модели является ее громоздкость для обработки информации с достаточно сложными логическими связями, а также сложность понимания для обычного пользователя. Примеры: зарубежные системы IMS, PC/Focus, Team-Up и Data Edge, а также отечественные системы Ока, ИНЭС и МИРИС;
IBM IMS - система управления информацией.
Система управления транзакционными и иерархическими базами данными IBM IMS является идеальным выбором для поддержки важнейших оперативных приложений и работы с данными, то есть для тех областей, где высокая доступность, производительность, емкость устройств хранения и целостность данных наряду с невысокой стоимостью являются важнейшими требованиями.
IMS помогает реализовать модель бизнеса "по требованию", способствует развитию, повышению доступности и эффективности управления системами, что требуется при эксплуатации существующих и внедрении новых сред, а также для управления расходами. Улучшения в IMS Database Manager (IMS DB) и IMS Transaction Manager (IMS TM) V10 открывают новые возможности - теперь вы сможете:
-Изменить способ ведения бизнеса благодаря интеграции информационных ресурсов.
-Создавать приложения для бизнеса "по требованию", которые позволят устранить трудности, связанные с ведением бизнеса через Интернет.
-Создать масштабируемую, доступную, безопасную и легкоуправляемую среду.
-Использовать существующие данные для принятия более взвешенных решений.
В настоящее время под системой общего назначения понимают программный комплекс, включающий единую и одинаково эффективную поддержку всех способов доступа и режимов работы. Скорее всего систем, полностью удовлетворяющих приведенному определению, не существует. Тем не менее, если исключить из списка обязательных свойств возможность управления базами данных на языке уровня DL/1 и одинаково эффективную для всех реализацию специализированных функций, то ряд систем по заложенным в них решениям можно отнести к системам общего назначения. В частности, в OS/MVS пакетный режим и режим разделения времени (TSO) поддерживаются не посредством специальных мониторов, а с помощью основных элементов системы и фактически интегрированы в иен. Этого, однако, нельзя сказать о механизмах системы управления базами данных IMS.
2) Реляционная модель данных: общее понятие и составные части. Фундаментальные свойства отношений. Реляционная алгебра. Реляционные исчисления.
Реляционная алгебра. Практически все используемые СУБД реляционные. В основе реляционной СУБД лежит метафора таблиц. Х (стрелка в бок и сверху)
В строках хранится описание какого-либо объекта окружающего мира. В столбцах -описание одного из свойств. Свойства являются атомарными – обязательное условие. Адрес – единое целое, например название страны, улицы. Неупорядоченность – основное