В реляционной модели данных должны выполняться условия целостности данных.
Реляционная целостность – это ограничения, которые предотвращают помещение в БД противоречивых данных. Их два:
· целостность отношений–первичный ключ не должен содержать отсутствующего значения;
· ссылочная целостность–значение внешнего ключа должно обязательно быть в качестве одного из значений первичного ключа.
2.3.2. Операции над отношениями |
В процессе обработки реляционных таблиц СУБД выполняет операции реляционной алгебры:
· объединение, пересечение, декартово произведение, разность, являющиеся традиционными операциями над множествами;
· специальные операции – проекция, выбор, соединение, деление.
Операции объединения (È), пересечения (Ç), разности (-) производятся над двумя исходными отношениями R1 и R 2, имеющими одинаковый состав и порядок атрибутов. Результатом является отношение такой же структуры.
Объединением двух отношений R1, R2 называется отношение R, содержащее множество кортежей, принадлежащих либо R1, либо R2, либо обоим отношениям R1, R2 одновременно.
Пересечениемотношений R1 и R2 называется отношение R, которое содержит множество кортежей, принадлежащих одновременно и R1, и R2.
Декартово произведение является операцией над двумя отношениями R1 и R 2, имеющими в общем случае разную структуру. Результат – отношение R1*R 2 – содержит число кортежей, равное произведению количеств кортежей в исходных отношениях.
Разностью отношений R1 и R2 называется отношение R, содержащее множество кортежей, принадлежащих R1 и не принадлежащих R2.
Операция проекции – это выбор атрибутов в отношении.
Операции выборки – это выбор кортежей в отношении по условию.
Операция соединения отношений R1, R2 выполняется путем сцепления по условию кортежей отношения R1 с кортежами отношения R2 . При этом в результирующее отношение R одинаковые атрибуты включаются только один раз.
Деление – операция над двумя отношениями R1 и R 2, имеющими в общем случае разные структуры и некоторые одинаковые домены. Структура результирующего отношения получается исключением из множества доменов в R1 множества доменов в R 2. Среди кортежей не должно быть дубликатов.
2.3.3.Достоинства и недостатки реляционной модели данных
Достоинство реляционной модели данных заключается в том, что она простота для понимания, наглядна и имеет строгое математическое обоснование.
Недостатки следующие:
· реляционная модель данных не допускает представления объектов со сложной структурой, так как в ее рамках возможно моделирование лишь с помощью двумерных таблиц;
· данные об объектах содержатся, как правило, во многих таблицах и извлечение информации о них требует выполнения многих операций соединения.
2.4.Постреляционная модель данных
Постреляционная модель данных представляет собой расширенную реляционную модель, снимающую ограничение неделимости данных, хранящихся в записях таблиц. Эта модель допускает многозначные поля – поля, значения которых состоят из подзначений.
Так, в постреляционной модели допустимо представление данных в виде следующей таблицы:
Номер накладной | Номер покупателя | Название товара | Количество товара |
Сыр | |||
Рыба | |||
Лимонад | |||
Сок | |||
Печенье | |||
Йогурт |
Достоинствами постреляционной модели данных являются:
· обеспечение высокой наглядности представления данных и повышение эффективности их обработки;
· отсутствие ограничений на длину полей и их количество в записях таблицы.
Недостаток постреляционнной модели – сложность в обеспечении целостности данных.
2.5.Объектно-ориентированная модель данных
Объектно-ориентированная модель данных(ООМД) – структура, которую можно изобразить графически в виде дерева, узлами которого являются объекты.
Основные понятия ООМД:
· объекты–отражение сущностей реального мира средствами проектирования БД. Каждый объект имеет уникальный идентификатор, состояние и поведение. Состояние объекта определяется множеством значений его атрибутов. Поведение объекта описывают методы, называемые процедурами или операциями;
· классы– объекты, схожие по поведению и другим свойствам;
· наследование – новый класс объектов можно образовать на основе уже существующего класса, называемого базовым или родительским;
· инкапсулирование –способ доступа к данным только лишь в соответствии с правилами поведения, не запрещенными или явно разрешенными объектом;
· расширяемость–возможность свободно добавлять в БД новые объекты и связанные с ними правила поведения данных, не вступая в конфликт с существующими объектами и приложениями;
· полиморфизм–способность объектов по-разному реагировать на одно и тоже событие в окружающем мире.
Главное достоинство ООМД – способность хранить информацию о сложных объектах с исчерпывающим описанием взаимосвязей между ними и их динамического поведения. Составной частью описания объекта является программа, которая способна производить действия над атрибутами объекта в случае наступления тех или иных событий. То есть, осуществляется связывание данных и программ согласно принципу инкапсулирования. ООМД обычно применяется при моделировании сложных предметных областей, когда не хватает функциональности реляционной модели (например, систем автоматизации проектирования, издательских систем и т.п.).
Недостатком ООМД является сложность понятийного аппарата, что усложняет ее применение и отрицательно сказывается на накоплении опыта создания и эксплуатации объектно-ориентированных БД.
2.6.Объектно-реляционная модель данных
Объектно-реляционная модель данных (ОРМД) – это модификация реляционной модели.
В ОРМД сочетаются возможности реляционной модели с объектными свойствами данных. Отличительная ее особенность от ООМД состоит в том, что она основана на стратегии реляционной модели. Разработчики технологий БД еще не пришли к единому мнению о том, как следует определять данную модель и о включении объектов в реляционную модель можно говорить только как об общем направлении развития БД.
2.7. Многомерная модель
Многомерная модель означает многомерное логическое представление структуры информации при ее описании и в операциях манипулирования данными.
Многомерная модель предназначена для аналитической обработки информации, представления ее в различных разрезах.
Основные понятия многомерной модели: |
· измерение – множество однотипных данных, образующих одну из граней гиперкуба;
· ячейка (показатель) – значение, которое однозначно определяется фиксированным набором измерений.
На рис. 3 представлена трехмерная модель, описывающая объемы продаж автомобилей трех марок тремя менеджерами за три года.
Рис. 3. Трехмерная модель данных
В многомерной модели данных используется два варианта организации данных – гиперкубическая и поликубическая.
В гиперкубической все кубы определяются одним и тем же набором измерений (максимально возможным). В некоторых случаях информация может быть избыточной, так как требуется обязательное заполнение ячеек.
В поликубической определяются несколько гиперкубов с различной размерностью и различными измерениями в качестве граней.
Для извлечения данных из базы, организованной по многомерной модели, применяется ряд специальных операций: срез, вращение, агрегация и детализация.
Достоинством многомерной моделиявляется удобство и эффективность аналитической обработки больших объемов данных, связанных с временными интервалами.
Недостатком является громоздкость для простейших задач оперативной обработки информации.
3. ПРОЕКТИРОВАНИЕ БАЗЫ ДАННЫХ
3.1. Этапы жизненного цикла базы данных
Проектирование базы данных– это процесс создания БД, предназначенной для поддержки функционирования экономического объекта и способствующей достижению его целей.
При проектировании БД необходимо учитывать тот факт, что БД должна удовлетворять комплексу следующих требований:
1) целостность БД (полнота и непротиворечивость данных);
2) многократное использование данных;
3) быстрый поиск и получение информации по запросам пользователей;
4) простота обновления данных;
5) уменьшение излишней избыточности данных;
6) защита данных от несанкционированного доступа, от искажения и уничтожения.
Процесс проектирования, реализации и поддержки БД называется жизненным циклом БД (ЖЦБД). ЖЦБД состоит из следующих семи этапов:
1) предварительное планирование – создание обобщенной концептуальной модели данных;
2) проверка осуществимости – выясняется, есть ли необходимое оборудование, программное обеспечение, персонал, средства для реализации запланированной БД и окупится ли она?;
3) определение требований – формулировка цели БД, информационных потребностей различных структурных подразделений и их руководителей, требований к оборудованию и программному обеспечению;
4) концептуальное проектирование – создание концептуальной модели(или концептуальной схемы БД), которая фиксирует все элементы корпоративных данных, подлежащих загрузке в БД;
5) логическое проектирование – выбор типа модели данных и отображение концептуальной модели в логическую модель, основанную уже на структурах, характерных для выбранной модели;
6) физическое проектирование – расширение логической модели характеристиками, необходимыми для создания БД в памяти компьютера (определение способов физического хранения базы данных, типа устройств для хранения, методов доступа к данным базы, требуемого объема памяти, правил сопровождения БД и др.);
7) оценка работы и поддержка БД – опрос пользователей на предмет выяснения, какие их информационные потребности остались неучтенными; внесение при необходимости изменений в спроектированную БД; разработка новых прикладных программ, работающих с БД; обучение пользователей работе с БД.
3.2. Модель «сущность-связь» (ER-модель)
Средством моделирования предметной области на этапе концептуального проектирования является модель «сущность–связь» (ER-модель, Entity – сущность, Relation – связь). В ней моделирование структуры данных предметной области базируется на использовании графических средств – ER-диаграмм (диаграмм «сущность–связь»), которые в наглядном виде представляют связи между сущностями.
Основные понятия ER-диаграммы – сущность, атрибут, связь.
Сущность – это некоторый объект реального мира, который может существовать независимо. На ER-диаграмме сущность представляется прямоугольником, например:
|
Атрибут– это свойство сущности. Атрибут, который уникальным образом идентифицирует экземпляры сущности, называется ключевым. Может быть составнойключ, представляющий комбинацию нескольких атрибутов.
Сущность имеет экземпляры, отличающиеся друг от друга значениями атрибутов и допускающие однозначную идентификацию.
Связь представляет взаимодействие между сущностями. На ER-диаграмме связь представляется ромбом, например:
Мощность связи показывает, сколько сущностей участвует в связи. Связь между двумя сущностями называется бинарной, а связь между более чем с двумя сущностями – n-арной.
Предположим, что проектируется БД, предназначенная для хранения информации о деятельности некоторого банка. Этот банк имеет филиалы. Филиалы управляются менеджерами. Клиенты имеют в филиалах счета разных типов – текущие, срочные, до востребования, депозитные, карточные. Филиалы обрабатывают эти счета. Описываемую предметную область назовем БАНК. В ней могут быть выделены четыре сущности – филиал, менеджер, счет, клиент и три связи:
1) МЕНЕДЖЕР – УПРАВЛЯЕТ – ФИЛИАЛ;
2) ФИЛИАЛ – ОБРАБАТЫВАЕТ – СЧЕТ;
3) КЛИЕНТ – ИМЕЕТ – СЧЕТ.
Типы связи
Если каждый экземпляр сущности А может быть связан не более чем с одним экземпляром сущности В, то связь между сущностями А и В имеет тип «один-к-одному» (1:1). Связь 1в предметной областиБАНК типа 1:1 и ее ER-диаграмма имеет вид:
Если каждый экземпляр сущности А может быть связан более чем с одним экземпляром сущности В, а каждый экземпляр сущности В может быть связан не более чем с одним экземпляром сущности А, то связь между сущностями А и В имеет тип «один-ко-многим» (1:М). Связь 2в предметной областиБАНК типа 1:М (изобразите ее ER-диаграмму).
Если каждый экземпляр сущности А может быть связан с несколькими экземплярами сущности В, и каждый экземпляр сущности В может быть связан с несколькими экземплярами сущности А, то связь между сущностями А и В имеет тип «многие-ко-многим» (М:N).Связь 3в предметной областиБАНК типа М:N. (изобразите ее ER-диаграмму).
3.2.2. Понятие«класс принадлежности сущности»
Если каждый экземпляр сущности А связан с экземпляром сущности В, то класс принадлежности (КП) сущности А является обязательным. Обязательный КП сущности отмечается на ER-диаграмме черным кружочком, помещенным в прямоугольник, смежный с прямоугольником сущности А.
Если не каждый экземпляр сущности А связан с экземпляром сущности В, то класс принадлежности сущности А является необязательным. Необязательный КП сущности отмечается на ER-диаграмме черным кружочком, помещенным на линии связи возле прямоугольника сущности А.
На нижеприведенной ER-диаграмме изображены обязательный КП сущности КЛИЕНТ и необязательный КП сущности СЧЕТ.
|
|
Если предположить, что КП всех сущностей предметной области БАНКобязательный, то ее ER-модель будет иметь вид, как на рис. 4.
Каждая из четырех сущностей приведенной ER-модели может быть описана своим набором атрибутов (рис. 5).
МЕНЕДЖЕР | ФИЛИАЛ | |
Номер менеджера (НМ) | Номер филиала (НФ) | |
Стаж работы (СТАЖ) | Адрес филиала (АДР_Ф) | |
Специальность (СПЕЦ) | ||
КЛИЕНТ | ||
СЧЕТ | Номер клиента (НК) | |
Номер счета (НС) | Ф.И.О. клиента (ФИО_К) | |
Тип счета (ТИП) | Социальное положение (СОЦ) | |
Остаток на счете (ОСТ) | Адрес клиента (АДР_К) |
Рис. 5. Наборы атрибутов сущностей предметной области БАНК
Примечание. Ключевые атрибуты выделены жирным шрифтом.
ER-модель в совокупности с наборами атрибутов сущностей может служить примером концептуальной модели предметной области или концептуальной схемы базы данных.
Дата добавления: 2020-10-25; просмотров: 783;