Теория нормализации отношений

Автор работы: Пользователь скрыл имя, 19 Мая 2012 в 13:02, реферат

Краткое описание

Нормализация отношений (таблиц) — одна из основополагающих частей теории реляционных баз данных. Нормализация имеет своей целью избавиться от избыточности в отношениях и модифицировать их структуру таким образом, чтобы процесс работы с ними не был обременён различными посторонними сложностями. При игнорировании такого подхода эффективность проектирования стремительно снижается, что вкупе с прочими подобными вольностями может привести к критическим последствиям. Нормализация отношений — это итерационный обратный процесс декомпозиции начального отношения на несколько более простых отношений меньшей размерности. Под возвратностью процесса понимают то, что операция объединения отношений, полученных в результате декомпозиции, должна дать начальное отношение.

Содержание

Введение 3
Основные понятия нормализации отношений 4
Нормальные формы 7
Первая нормальная форма (1НФ) 7
Вторая нормальная форма (2НФ) 8
Третья нормальная форма (3НФ) 11
Нормальная форма Бойса-Кодда (НФБК) 14
Четвертая нормальная форма (4НФ) 16
Пятая нормальная форма (5НФ) 18
Доменно-ключевая нормальная форма (ДКНФ) 20
Заключение 21
Список использованной литературы 22

Вложенные файлы: 1 файл

реферат по РиСПСиИТ.docx

— 40.74 Кб (Скачать файл)

Министерство  образования и науки РФ 

САРАТОВСКИЙ ГОСУДАРСТВЕННЫЙ  УНИВЕРСИТЕТ

ИМЕНИ Н.Г. ЧЕРНЫШЕВСКОГО 
 
 

РАЗРАБОТКА  И СТАНДАРТИЗАЦИЯ

ПРОГРАММНЫХ СРЕДСТВ И ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Реферат на тему: Теория нормализации отношений (6 форм) 
 
 
 

                Подготовил:

                студент механико-математического факультета 442 группы

                Гижко Дарья

 

Саратов 2012 г.

                                                                 Оглавление

    Введение 3

    Основные понятия нормализации отношений 4

    Нормальные формы 7

    Первая нормальная форма (1НФ) 7

    Вторая нормальная форма (2НФ) 8

    Третья нормальная форма (3НФ) 11

    Нормальная форма Бойса-Кодда (НФБК) 14

    Четвертая нормальная форма (4НФ) 16

    Пятая нормальная форма (5НФ) 18

    Доменно-ключевая нормальная форма (ДКНФ) 20

    Заключение 21

    Список использованной литературы 22 
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     

Введение

Нормализация  отношений (таблиц) — одна из основополагающих частей теории реляционных баз данных. Нормализация имеет своей целью  избавиться от избыточности в отношениях и модифицировать их структуру таким  образом, чтобы процесс работы с  ними не был обременён различными посторонними сложностями. При игнорировании  такого подхода эффективность проектирования стремительно снижается, что вкупе  с прочими подобными вольностями  может привести к критическим  последствиям. Нормализация отношений  — это итерационный обратный процесс  декомпозиции начального отношения  на несколько более простых отношений  меньшей размерности. Под возвратностью  процесса понимают то, что операция объединения отношений, полученных в результате декомпозиции, должна дать начальное отношение.  В результате нормализации состав атрибутов отношений  БД должны отвечать таким требованиям:

- между  атрибутами должны исключаться  нежелательные функциональные  зависимости;

- группирование  атрибутов не должно иметь  убыточного дублирования данных;

- обеспечивать  обработку и обнобновление атрибутов без осложнений.

Аппарат нормализации был разработан американским ученым Э.Ф. Коддом. Каждая нормальная форма ограничивает тип допустимых зависимостей между атрибутами. 
 
 
 

Основные  понятия нормализации отношений

Процесс проектирования представляет собой  процесс нормализации схем отношений, причем каждая следующая нормальная форма обладает свойствами лучшими, чем предыдущая. Каждой нормальной форме соответствует некоторый  определенный набор ограничений, и  отношение находится в некоторой  нормальной форме, если удовлетворяет  свойственному ей набору ограничений. Примером набора ограничений является ограничение первой нормальной формы - значения всех атрибутов отношения  атомарны. Поскольку требование первой нормальной формы является базовым требованием классической реляционной модели данных, мы будем считать, что исходный набор отношений уже соответствует этому требованию.

 В  теории реляционных баз данных  обычно выделяется следующая  последовательность нормальных  форм:

- первая нормальная форма (1NF);

- вторая нормальная форма (2NF);

- третья нормальная форма (3NF);

- нормальная форма Бойса-Кодда (BCNF);

- четвертая нормальная форма (4NF);

  - пятая нормальная форма, или нормальная форма проекции-соединения (5NF или PJ/NF);

  - доменно–ключевая нормальная форма.

Основные  свойства нормальных форм:

  - каждая следующая нормальная форма в некотором смысле лучше предыдущей;

  - при переходе к следующей нормальной форме свойства предыдущих нормальных свойств сохраняются.

 В  основе процесса проектирования  лежит метод нормализации, декомпозиция  отношения, находящегося в предыдущей  нормальной форме, в два или  более отношения, удовлетворяющих  требованиям следующей нормальной  формы. Наиболее важные на практике  нормальные формы отношений основываются  на фундаментальном в теории  реляционных баз данных понятии  функциональной зависимости. Для  дальнейшего изложения нам потребуются  несколько определений. 

 Определение  1. Функциональная зависимость 

 В  отношении R атрибут Y функционально  зависит от атрибута X (X и Y могут  быть составными) в том и только  в том случае, если каждому  значению X соответствует в точности  одно значение Y: R.X (r) R.Y.

 Определение  2. Полная функциональная зависимость 

 Функциональная  зависимость R.X (r) R.Y называется полной, если атрибут Y не зависит функционально от любого точного подмножества X.

 Определение  3. Транзитивная функциональная зависимость 

 Функциональная  зависимость R.X -> R.Y называется  транзитивной, если существует такой  атрибут Z, что имеются функциональные  зависимости R.X -> R.Z и R.Z -> R.Y и  отсутствует функциональная зависимость  R.Z --> R.X. (При отсутствии последнего  требования мы имели бы "неинтересные" транзитивные зависимости в любом  отношении, обладающем несколькими  ключами.)

 Определение  4. Неключевой атрибут

 Неключевым атрибутом называется любой атрибут отношения, не входящий в состав первичного ключа (в частности, первичного).

 Определение  5. Взаимно независимые атрибуты 

 Два  или более атрибута взаимно  независимы, если ни один из  этих атрибутов не является  функционально зависимым от других.

Нормализация  – это формальный метод анализа  отношений на основе их первичного ключа (или потенциальных ключей) и существующих функциональных зависимостей. Он включает ряд правил, которые  использоваться для проверки отдельных  отношений таким образом, чтобы  вся база данных могла быть нормализована  до желаемой степени. Чаще всего нормализация осуществляется в виде нескольких последовательно  выполняемых этапов, каждый из которых  соответствует определенной нормальной форме, обладающей известными свойствами. В ходе нормализации формат отношений становится все более ограниченным (строгим) и менее восприимчивым к аномалиям обновления. При работе с реляционной моделью данных важно понимать, что для создания отношений приемлемого качества обязательно только выполнение требований первой нормальной формы(1НФ). Все остальные формы могут использоваться по желанию проектировщиков. Но для того чтобы избежать аномалий обновления нормализацию рекомендуется выполнять как минимум до третьей нормальной формы (3НФ).

Аномалии  модификации:

Аномалия  удаления – т.е., удаляя факты, относящиеся  к одной сущности, мы непроизвольно  удаляем факты, относящиеся к  другой сущности.

 Аномалия  ввода -  мы хотим записать  в базу данных факт, однако  мы не можем ввести эти данные  в отношение, пока хотя бы  один факт не будет записан  в это отношение. 

Нормальные  формы

Первая  нормальная форма (1НФ)

Таблица находится в первой нормальной форме (1НФ) если: ячейки таблицы должны содержать  одиночные значения и в качестве значений не допускаются ни повторяющиеся  группы, ни массивы. Все записи в  одном столбце (атрибуте) должны иметь  один и  тот же тип. Каждый столбец  должен иметь уникальное имя, но порядок  следования столбцов в таблице несуществен. В таблице не может быть двух одинаковых строк, порядок следования строк  в таблице несуществен. Отношения  на след. рисунке находятся в первой нормальной форме, однако они могут иметь аномалии модификации. Чтобы удалить эти аномалии, мы разбиваем отношения на два или более новых отношений.

 
 
 
 
 
 
 
 
 

Вторая  нормальная форма (2НФ)

Отношения находятся во второй нормальной форме, если все его неключевые атрибуты зависят от всего ключа. В соответствии с этим определением, если отношение имеет в качестве ключа одиночный атрибут, то оно автоматически находится во второй нормальной форме. Поскольку ключ является одиночным атрибутом, то по умолчанию каждый неключевой атрибут зависит от всего ключа, и частичных зависимостей не может быть.

 Рассмотрим  следующий пример схемы отношения: 

 СОТРУДНИКИ-ОТДЕЛЫ-ПРОЕКТЫ 

(СОТР_НОМЕР,  СОТР_ЗАРП, ОТД_НОМЕР, ПРО_НОМЕР, СОТР_ЗАДАН)

 Первичный  ключ:

 СОТР_НОМЕР,  ПРО_НОМЕР 

 Функциональные  зависимости: 

 СОТР_НОМЕР  -> СОТР_ЗАРП 

 СОТР_НОМЕР  -> ОТД_НОМЕР

 ОТД_НОМЕР -> СОТР_ЗАРП

 СОТР_НОМЕР,  ПРО_НОМЕР -> СОТР_ЗАДАН 

 Как  видно, хотя первичным ключом  является составной атрибут СОТР_НОМЕР,  ПРО_НОМЕР, атрибуты СОТР_ЗАРП  и ОТД_НОМЕР функционально зависят от части первичного ключа, атрибута СОТР_НОМЕР. В результате мы не сможем вставить в отношение СОТРУДНИКИ-ОТДЕЛЫ-ПРОЕКТЫ кортеж, описывающий сотрудника, который еще не выполняет никакого проекта (первичный ключ не может содержать неопределенное значение). При удалении кортежа мы не только разрушаем связь данного сотрудника с данным проектом, но утрачиваем информацию о том, что он работает в некотором отделе. При переводе сотрудника в другой отдел мы будем вынуждены модифицировать все кортежи, описывающие этого сотрудника, или получим несогласованный результат. Такие неприятные явления называются аномалиями схемы отношения. Они устраняются путем нормализации.

 Вторая  нормальная форма (в этом определении  предполагается, что единственным  ключом отношения является первичный  ключ)

 Отношение  R находится во второй нормальной  форме (2NF) в том и только  в том случае, когда находится  в 1NF, и каждый неключевой атрибут полностью зависит от первичного ключа.

 Можно  произвести следующую декомпозицию  отношения СОТРУДНИКИ-ОТДЕЛЫ-ПРОЕКТЫ  в два отношения СОТРУДНИКИ-ОТДЕЛЫ  и СОТРУДНИКИ-ПРОЕКТЫ: 

 СОТРУДНИКИ-ОТДЕЛЫ (СОТР_НОМЕР, СОТР_ЗАРП, ОТД_НОМЕР)

 Первичный  ключ:

 СОТР_НОМЕР 

 Функциональные  зависимости: 

 СОТР_НОМЕР  -> СОТР_ЗАРП 

 СОТР_НОМЕР  -> ОТД_НОМЕР

 ОТД_НОМЕР -> СОТР_ЗАРП

 СОТРУДНИКИ-ПРОЕКТЫ  (СОТР_НОМЕР, ПРО_НОМЕР, СОТР_ЗАДАН) 

 Первичный  ключ:

 СОТР_НОМЕР,  ПРО_НОМЕР 

 Функциональные  зависимости: 

 СОТР_НОМЕР,  ПРО_НОМЕР -> CОТР_ЗАДАН

 Каждое  из этих двух отношений находится  в 2NF, и в них устранены отмеченные  выше аномалии (легко проверить,  что все указанные операции  выполняются без проблем).

 Отношение  R находится во второй нормальной  форме (2NF) в том и только  в том случае, когда оно находится  в 1NF, и каждый неключевой атрибут полностью зависит от каждого ключа R.

 Здесь  и далее мы не будем приводить  примеры для отношений с несколькими  ключами. Они слишком громоздки  и относятся к ситуациям, редко  встречающимся на практике. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Третья  нормальная форма (3НФ)

Отношения находятся в третьей нормальной, если оно находится во второй нормальной форме и  не имеет транзитивных зависимостей.

 Транзитивная  зависимость – неключевой атрибут функционально зависит от неключевых атрибутов. (транзитивная зависимость – если атрибут В зависит от атрибута А, а атрибут С зависит от атрибута В, то атрибут С транзитивно зависит от атрибута А).

 Отношения  в данной таблице также содержит  транзитивную зависимость. Номер  студента определяет атрибут  Секции, а Секции определяет атрибут  Плата, Поэтому отношения данной  таблицы не находится в третьей  нормальной форме. Разбиение этой  таблицы на две таблицы устраняет  аномалии.

Информация о работе Теория нормализации отношений