Мобильный LiveInternet Способы визуализации структур данных. ER-диаграммы.

Авторизация

Дневник TheLenka Лента друзей - Дневник - Полная версия

Способы визуализации структур данных. ER-диаграммы. 09-06-2010 11:24 к комментариям - к полной версии - понравилось!

При помощи средств визуализации поддерживаются важные задачи бизнеса, среди которых - процесс принятия решений. В связи с этим возникает необходимость перехода средств визуализации на более качественный уровень, который характеризуется появлением абсолютно новых средств визуализации и взглядов на ее функции, а также развитием ряда тенденций в этой области. Большинство визуализаций данных построено на основе диаграмм стандартного типа (секторные диаграммы, графики рассеяния и.т.д.). Эти способы являются одновременно старейшими, наиболее элементарными и распространенными. В последние годы перечень видов диаграмм, поддерживаемых инструментальными средствами визуализации, существенно расширился. Поскольку потребности пользователей весьма многообразны, инструменты визуализации поддерживают самые различные типы диаграмм. Средства создания диаграмм и презентационной графики предназначены главным образом для визуализации данных. Однако возможности такой визуализации обычно встроены и во множество различных других программ и систем - в инструменты репортинга и OLAP, средства для Text Mining и Data Mining, а также в CRM-приложения и приложения для управления бизнесом. Для создания встроенной визуализации многие поставщики реализуют визуализационную функциональность в виде компонент, встраиваемых в различные инструменты, приложения, программы и web-страницы (в том числе инструментальные панели и персонализированные страницы порталов).

Повышение уровня взаимодействия с визуализацией пользователя. Еще совсем недавно большая часть средств визуализации представляла собой статичные диаграммы, предназначенные исключительно для просмотра. Сейчас широко используются динамические диаграммы, уже сами по себе являющиеся пользовательским интерфейсом, в котором пользователь может напрямую и интерактивно манипулировать визуализацией, подбирая новое представление информации. Например, базовое взаимодействие позволяет пользователю вращать диаграмму или изменять ее тип в поисках наиболее полного представления данных. Кроме того, пользователь может менять визуальные свойства - к примеру, шрифты, цвета и рамки. В визуализациях сложного типа (графиках рассеяния или диаграммах констелляции) пользователь может выбирать информационные точки с помощью мыши и перемещать их, облегчая тем самым понимание представления данных.

Более совершенные методы визуализации данных часто включают в себя диаграмму или любую другую визуализацию как составной уровень. Пользователь может углубляться (drill down) в визуализацию, исследуя подробности обобщенных ею данных, или углубляться в OLAP, Data Mining или другие сложные технологии. Сложное взаимодействие позволяет пользователю изменять визуализацию для нахождения альтернативных интерпретаций данных. Взаимодействие с визуализацией подразумевает минимальный по своей сложности пользовательский интерфейс, в котором пользователь может управлять представлением данных, просто "кликая" на элементы визуализации, перетаскивая и помещая представления объектов данных или выбирая пункты меню. Инструменты OLAP или Data Mining превращают непосредственное взаимодействие с визуализацией в один из этапов итерационного анализа данных. Средства Text Mining или управления документами придают такому непосредственному взаимодействию характер навигационного механизма, помогающего пользователю исследовать библиотеки документов.

Увеличение размеров и сложности структур данных, представляемых визуализацией. Элементарная секторная диаграмма или гистограмма визуализирует простые последовательности числовых информационных точек. Однако новые усовершенствованные типы диаграмм способны визуализировать тысячи таких точек и даже сложные структуры данных - например, нейронные сети. Скажем, средства OLAP (а также инструменты генерации запросов и выпуска отчетов) уже давно поддерживают диаграммы для своих онлайновых отчетов. Новые визуализационные программы обновляют контент за счет периодически повторяющегося считывания данных.

Пользователи инструментов Data Mining обычно анализируют очень большие наборы численных данных. Традиционные типы диаграмм для бизнеса (секторные диаграммы и гистограммы) плохо справляются с представлением тысяч информационных точек. Поэтому инструменты Data Mining почти всегда поддерживают некую форму визуализации данных, способную отражать структуры и закономерности исследуемых наборов данных, в соответствии с тем аналитическим подходом, который используется в инструменте.

Помимо того, что визуализация поддерживает обработку структурированных данных, она также является ключевым средством представления схем так называемых неструктурированных данных, например текстовых документов, т.е. Text Mining.

Выводы. Как показывают многие исследования, визуализация является одним из наиболее перспективных направлений анализа данных, в т.ч. Data Mining. Однако в этом направлении можно выделить проблемы, такие как сложность ориентации среди огромного количества инструментов, предлагающих решения по визуализации, а также непризнание рядом специалистов методов визуализации как полноценных средств анализа и навязывание им вспомогательной роли при использовании других методов. Однако у визуализации есть неоспоримые преимущества: она может служить источником информации для пользователя, не требуя теоретических знаний и специальных навыков работы, может выступить тем языком, который объединит профессионалов из различных проблемных областей, может превратить исходный набор данных в изображение, благодаря которому у исследователя могут появиться абсолютно новые, неожиданные решения. Диаграммы "сущность-связь" (ERD) предназначены для графического представления моделей данных разрабатываемой программной системы и предлагают набор стандартных обозначений для определения данных и отношений между ними. С помощью этого вида диаграмм можно описать отдельные компоненты концептуальной модели данных и совокупность взаимосвязей между ними. Основными понятиями данной нотации являются понятия сущности и связи. При этом под сущностью (entity) понимается произвольное множество реальных или абстрактных объектов, каждый из которых обладает одинаковыми свойствами и характеристиками. В этом случае любой рассматриваемый объект может быть экземпляром одной и только одной сущности, должен иметь уникальное имя или идентификатор, а также отличаться от других экземпляров данной сущности.

Связь (relationship) определяется как отношение или ассоциация между отдельными сущностями. Примерами связей могут являться родственные отношения, в частности "отец-сын" или производственные - "начальник-подчиненный". Другой тип связей задается отношениями "иметь в собственности" или "обладать свойством". Различные типы связей графически изображаются в форме ромба с соответствующим именем данной связи. Графическая модель данных строится таким образом, чтобы связи между отдельными сущностями отражали не только семантический характер соответствующего отношения, но и дополнительные аспекты обязательности связей, а также кратность участвующих в данных отношениях экземпляров сущностей. Нотация диаграмм (ERD) реализована в различных программных средствах. Пример диаграммы ERD, разработанной с помощью средства моделирования бизнес-процессов ARIS®. Ограниченность диаграмм ERD проявляется при конкретизации концептуальной модели в более детальное представление моделируемой программной системы, которое кроме статических связей должно содержать информацию о поведении или функционировании отдельных ее компонентов.

2)Представления. Определение представления. SQL предложения CREATE VIEW и DROP VIEW. Особенности операций выборки и обновления для представлений. Использование представлений для разграничения доступа к данным.

Специальные операторы языка SQL позволяют определять так называемые представления БД, фактически являющиеся хранимыми в БД запросами (результатом любого запроса к реляционной БД является таблица) с именованными столбцами. Для пользователя представление является такой же таблицей, как любая базовая таблица, хранимая в БД, но с помощью представлений можно ограничить или наоборот расширить видимость БД для конкретного пользователя. Поддержание представлений производится также на языковом уровне.

Предложения Sql Определение Данных:CREATE VIEW – создать представление

CREATE VIEW view_name AS SELECT column_name(s) FROM table_name WHERE condition DROP VIEW – удалить представление

Представление – это та же самая таблица, которая реально не существует (сохраненный внутри СУБД SELECT, которому приписано соответствующее имя; усеченная таблица). Доступ пользователям к таблицам осуществляется через представление. Существует два подхода: храним все, что можно, храним все, что нельзя вычислить

Представление позволяет объединить оба подхода. Прежде, чем работать с таблицей она должна выполнить SELECT. При создании представления необходимо разграничить права. Использование: 1.Управление данными, когда надо свести несколько таблиц вместе хорошо использовать представление, т.е. объединить таблицы. 2.разграничение доступа. Безопасность. Пользователь видит только предоставленные ему данные.

Предложения Grant И Revoke

GRANT {привилегии} ON {объекты} TO {пользователи} [ WITH ADMIN OPTION]

Привилегии для таблиц и представлений: SELECT UPDATE (может относиться к конкретным столбцам) DELETE INSERT ALL PRIVILEGES – все привилегии

Только для базовых таблиц: ALTER INDEX

Можно отдать права администратора на таблицу. В большинстве СУБД можно добавить привилегии на столбец, но обычно это целая таблица.

grant select on table s to u1805; grant select, update (city, person) on table s to u1805, mary, bob; grant all priveleges on table s, p, sp to boss; grant select on table p to public; revoke {привилегии} [on объекты] from {пользователи}

revoke select on table s from u1805; Отмена привилегии UPDATE не может относиться к конкретным столбцам

3)Архитектура IBM zArchitecture и IBM eServer zSeries (System/390) –архитектуры для построения централиз хранилищ данных большой ёмкости с нулевым временем простоя. Особенности архитектуры. Подсистема ввода/вывода.

IBM System z (более ранне название IBM eServer zSeries) — бренд созданный компанией IBM, для обозначения линейки мейнфреймов. Буква Z происходит от «zero down time», означающее нулевое время простоя, что отражает одно из главных качеств сервера — высочайшую надежность, позволяющую непрерывно поддерживать работу сервера на заданном уровне производительности по схеме 24 × 7 × 365 то есть 24 часа в сутки × 7 дней в неделю × 365 дней в году.

История В 2000 году компания IBM сменила название IBM System/390 на IBM eServer zSeries и уже в октябре 2000 была выпущена первая модель этого семейства zSeries 900.

Мейнфре́йм (от англ. mainframe) —Большая универсальная ЭВМ — высокопроизводительный компьютер со значительным объёмом оперативной и внешней памяти, предназначенный для организации централизованных хранилищ данных большой ёмкости и выполнения интенсивных вычислительных работ. Компьютер c архитектурой IBM System/360, 370, 390, zSeries. Современные мейнфреймы перестали быть закрытой платформой: они способны поддерживать на одной машине сотни серверов с различными ОС. Среднее время наработки на отказ оценивается в 12—15 лет. Надежность мейнфреймов — это результат почти 60-летнего их совершенствования. Группа разработки VM/ESA затратила двадцать лет на удаление ошибок из операционной системы, и в результате была создана система, которую можно использовать в самых ответственных случаях. Повышенная устойчивость систем. Мейнфреймы могут изолировать и исправлять большинство аппаратных и программных ошибок за счет использования следующих принципов. Дублирование: два резервных процессора, запасные микросхемы памяти, альтернативные пути доступа к периферийным устройствам. Горячая замена всех элементов вплоть до каналов, плат памяти и центральных процессоров.

Целостность данных. В мейнфреймах используется память, исправляющая ошибки. Ошибки не приводят к разрушению данных в памяти, или данных, ожидающих устройства ввода-вывода. Дисковые подсистемы построенные на основе RAID-массивов с горячей заменой и встроенных средств резервного копирования защищают от потерь данных. Рабочая нагрузка мейнфреймов может составлять 80—95 % от их пиковой производительности.

Пропускная способность подсистемы ввода-вывода мейнфреймов разработана так, чтобы работать в среде с высочайшей рабочей нагрузкой на ввод-вывод. Масштабирование может быть как вертикальным так и горизонтальным. Вертикальное масштабирование обеспечивается линейкой процессоров с производительностью от 5 до 200 MIPS и наращиванием до 12 центральных процессоров в одном компьютере. Горизонтальное масштабирование реализуется объединением ЭВМ в Sysplex (System Complex) — многомашинный кластер, выглядящий с точки зрения пользователя единым компьютером. Всего в Sysplex можно объединить до 32 машин. Географически распределенный Sysplex называют GeoPlex.

Доступ к данным. Поскольку данные хранятся на одном сервере, требуется небольшое количество физических серверов и значительно более простое программное обеспечение. Все это, в совокупности, ведет к повышению скорости и эффективности обработки. Защита. Встроенные в аппаратуру возможности защиты, такие как криптографические устройства, и Logical Partition, и средства защиты операционных систем, дополненные программными продуктами RACF или VM:SECURE, обеспечивают совершенную защиту. Пользовательский интерфейс всегда оставался наиболее слабым местом мейнфреймов. Сейчас же стало возможно для прикладных программ мейнфреймов, в кратчайшие сроки и при минимальных затратах, обеспечить современный интернет-интерфейс.

Для архитектуры типа выделенная память требуются аппаратные средства и ОС. Причем, процесс архивирования требует обычно дополнительного специального программного и аппаратного обеспечения. Архитектура этого типа применяется сейчас практически везде. Простейшим примером является файловый сервер. При применении такой архитектуры существует несколько проблем. Первой из них является перегруженность серверов при доступе к данным (даже не при их обработке). Вторая проблема заключается в том, что в настоящее время на мировом рынке присутствует множество систем управления устройствами хранения данных, базирующихся на разных технологиях (но построенных в соответствии с архитектурой типа выделенная память). Такое многообразие не способствует унификации и приводит к необходимости отдельного развития каждой такой системы. В третьих, вследствие необходимости передачи транзитных данных между серверами в сетях их работа становится неэффективной. Выполнение процедуры дополнительной обработки данных значительно снижает эффективность работы сервера и производительность работы компьютерных сетей.

Подсистема ввода / вывода является "козырной картой" мэйнфреймов. Сложная иерархия каналов и подканалов различного типа и назначения обеспечивает компьютерам этого класса возможность поддержки параллельного обмена с большим количеством разнотипных внешних устройств. К сожалению, за высокую эффективность указанной подсистемы приходится расплачиваться затратами не только на дополнительное оборудование каналов, но и на содержание громоздких периферийных устройств (дисков, лент, АЦПУ и т. д.). (далеко не все задачи, решаемые на платформе System / 390, оправдывают такие расходы).

В системе P/ 390 предусмотрено два способа выполнения процедур ввода / вывода, заимствованных у платформ System /370 и System / 390. В первом случае собственные внешние устройства мэйнфрейма подключаются к карте параллельного канала, устанавливаемой в разъем шины MCA. Таким образом с P/ 390 могут быть состыкованы практически все "большие" периферийные устройства, за исключением дисков. Достоинства подобного способа организации ввода / вывода очевидны: пользователям обеспечивается доступ ко всему арсеналу периферийных устройств мэйнфреймов.

Однако эти обширные возможности, предоставляемые картой параллельного канала, являются всего лишь дополнением альтернативного способа организации ввода/вывода в среде MVS/VM/VSE - с помощью эмуляции средствами подсистемы PC Server. Механизм эмуляции функций ввода/вывода System /370 или System/390 основан на перехвате ПК-сервером прерываний, формируемых подсистемой S/390 по командам инициализации канальных процедур SIO/SSCH.

Такая достаточно естественная схема отличается двумя весьма примечательными особенностями. С одной стороны, существование промежуточных драйверов Device Manager, выполняющих роль стыковочного модуля между стандартными средствами ввода/вывода среды MVS/VM/VSE и системы OS/2, позволяет IBM и ее партнерам постоянно расширять ассортимент эмулируемых периферийных устройств и оптимизировать процедуры ввода/вывода. Кроме того, при необходимости пользователи могут самостоятельно разработать необходимые драйверы для эмуляции нестандартных внешних устройств. С другой стороны, обеспечивается функционирование устройств ввода/вывода.

вверх^ к полной версии понравилось! в evernote

Комментарии (1):

Максим_Тимофеев 09-06-2010-11:43 удалить

Нашел удобный поиск часов по характеристикам

Обратиться - Ответить - К полной версии

Комментарии (1): вверх^

Вы сейчас не можете прокомментировать это сообщение.

Дневник Способы визуализации структур данных. ER-диаграммы. | TheLenka - Дневник Рыжей Девчонки | Лента друзей TheLenka / Полная версия Добавить в друзья Страницы: раньше»