Шпаргалка по "Технологии баз данных"

Автор работы: Пользователь скрыл имя, 12 Марта 2013 в 18:00, шпаргалка

Краткое описание

Предметной областью курса «Технологии организации, хранения и обработки данных» является часть реального мира, (это может быть предприятие, его часть, процесс, система и т.д.), которая описывается или моделируется с помощью информационных систем и разрабатываемого программного обеспечения. Информационные системы разного класса и назначения, предназначены для оперирования особо интенсивными потоками информации и олицетворяют собой новую человеко-машинную технологию сбора, обработки, передачи информации.

Вложенные файлы: 1 файл

шпоры технол.баз данных.doc

— 282.50 Кб (Скачать файл)

 

22.Многомерная  модель данных, ее базовые  понятия (измерение, ячейка),достоинства и недостатки.Многомерная модель-это модель с многомерным логическим представлением структуры информации.,предназн.для аналитич.обработки информ.Агрегируемость данных-возможность их рассмотрения с разл.уровнем обобщения.Историчность-обеспеч.выс.уровень статичности данных и их взаимосвязей,привязку данных к временным точкам.Прогнозируемость данных-задание ф-ций прогнозирования и применение их к разл.интервалам времени.Измерение-это множество однотипных данных,образующих одну из граней многомерного гиперкуба.Ячейка-это поле,значение кот.однозначно определяется фиксирован.набором измерений.В многмерной модели данных использ.2 варианта организации данных-гиперкубическая и поликубическая.В гиперкубической все кубы определ.одним и тем же набором измерений.В поликубической определ.неск.гиперкубов с разл.размерностью и разл.измерениями в качестве граней.Для того,чтобы извлечь данные из базы такой примен.след.:1)Срез-данные,получен.в результ.фиксации одного или неск.измерений.2)Вращение-примен.при двухмерном представл.данных.Она измен.порядок при визуальном представл.данных.3)Агрегация и детализация-переход к более или менее детальному представл.информации из гиперкуба.Достоинства:удобство и эффективность аналитич.обработки больших объёмов данных,связан.с временными интервалами.Недостаток:громоздкость для простейших задач оперативной обработки информации.

 

23.Объемы  современных баз данных и устройства  для их размещения.Соврем.БД имеют объёмы,кот.измер.в терабайтах(1Тб=1024 Гб) и петабайтах(1 Пб=1024 Тб)Для их хранения использ.устройства внешней памяти большого объёма.Жёсткие диски(винчестеры)примен.для хран.и использ.информ.БД.Они обеспеч.наиб.быстр.доступ к данным,выс.скорости чтения и записи данных,обеспеч.быстрое выполн.запросов к базе.Данные хранят на керамич.или алюмин.пластинах,на кот.с обеих сторон нанесено магнитное покрытие,спос.менять свои св-ва под возд.электромагн.излуч.Х-ка жёсткого диска-его ёмкость.С к.годом ёмкость увелич.Профес.устр.хран.БД-терабайтные  БД.RAID-массивы-это объединения неск.сравнит.дешёвых дисков в одно логич.устройство с целью повыш.общей ёмкости,быстродействия и надёжности.(исп.для офисных и дом.компов)Внешние RAID-массивы позвол.созд.высокоскоростные дисковые массивы любой необх.ёмкости.(исп.для хран.и использ.БД объёмом от 2 терабайтов и более,а также комп.обработка цифрового кино-и видеоматериала)CD-ROM-это один из видов оптич.накопителей информации,при работе кот.использ.лазерная технология.(информ.на нём м.только читать с пом.привода)Доступ к дан.на CD-ROM осущ.быстрее чем к дискетам,но медл.чем на жёстк.дисках.Это одност.носитель информ.CD-ROM диски имеют небольш.размер,надёжны,долговечны,исп.для хран.БД объёмом до 800 мб.DVD-диски-универс.цифровые диски.Имеют теже габариты как и комп.диск,но вмещ.больший объём информ.Примен.для хран.сверхбольш.БД и видеофильм.(информ.м.запис.с 2-х сторон:одностор.односл.,двустор.односл.,одност.двусл.,двустор.двуслойные)Созд.новый формат DVD-диска-Blu-Ray-диск,у кот.для записи и воспроизв.использ.не красный лазер,а синий.У них выс.скорость обмена данными с осн.устр.компа и облад.объёмом в 100 или 200 Гб.(хран.сверхбольш.БД и их использ.)Оптические библиотеки-этои новое поколение устройств для хран.больших объёмов данных.с их пом.м.организ.динамичный доступ к информ.БД объёмом от неск.десятков Гб до 5-6 терабайт.В этих устр.м.б.объединено более десяти приводов для чтения с CD-ROM и DVD-ROM.Оптич.библиотека,в кот.объедин.DVD-диски,назыв.роботозированной DVD-библиотекой.Они обеспеч.запись и считыв.информ.Для резервного копирования информ.БД использ.стримеры и магнитооптические диски.Стримеры-это мини-кассеты с магнитной лентой ёмкостью от 40Мб до 13Гб.Магнитооптические диски построены на совмещ.магнитного и оптического принципа хранения информ.(исп.при работе с персональными БД больших объёмов).

 

24.Физический  доступ к базе данных.Технич.специалисты заним.вопросами физ.организ.БД.Пользователи д.знать проблемы физ.реализ.БД и способы их реш.Показателем быстродействия явл.время отклика-промежуток времени между обращением пользователя к БД и получением результата.Большое время отклика не устраив.пользователя.эффект.физ.организ.БД обеспеч.манипулиров. данными-обновление,удаление,добавление новых данных-и извлеч.данных из базы за макс.короткое время.Пользователь взаимод. с БД,вводя команды.Программный компонент СУБД,называемый стратегическим селектором,преобразует команду в форму,эффект.для выполнения.Преобразов.команда активизир.программный компонент СУБД-буферный диспетчер,кот.контрол.перемещ.данных между диском и операт.памятью.Буферный диспетчер поддерж.диспетчер файлов-программный компонент,управл.структурами данных и размещением данных на диске.Диспетчер файлов взаимод.с диспетчером дисков-частью операц.сист.,с пом.кот.выполн.все дисковые операции ввода-вывода.Диспетчер дисков обращ.к диску,на кот.распол.БД.БД на диске представл.собой множество наборов,сост.из страниц строго фиксированного размера.К.набор страниц имеет уник.номер.Наборы не имеют общих страниц.Один из наборов сод.все имеющ.свободные страницы,не использ.для размещ.данных.Этот набор назыв. ещё свободным пространством на диске.К.страница внутри набора имеет уник.номер и сод.не более255 записей.К.запись имеет уник.в пределах страницы номер,кот.сост.из двух частей:номера страницы,на кот.эта запись нах.,и информации о смещении запси от конца страницы.Принцип кластеризации-возможность как м.более близко физически размещать логически связанные и часто использ.записи.Это важное усл.выс.пр-ности БД.

 

25.Индексирование  для ускорения извлечения данных.Для ускорен.доступа к данным базы по запросам пользователей использ.индексирование и хеширование.Индекс-это средство ускорения операций поиска в табл.БД,а также др.операций,требующих поиска:извлечения,корректировки,сортировки и т.д.Индексный файл-это файл,в кот.хран.информ.об индексе.Записи в нём состоят из 2 знач.:данного из индексированного файла;указателя номера записи индексированного файла,в кот.хран.информ.об этом данном.Файл данных м.иметь неск.индексов.Цель индексирования-это ускорение извлечения данных за счёт уменьшения к-ва дисковых операций ввода-вывода.

 

26. Технология хеширования

Хеширование –  технология быстрого прямого  доступа  к  записи БД на основе заданного  значения некоторого поля записи, как  правило, ключевого. Каждая запись БД размещается по адресу, кот. Вычисляет СУБД с помощью хеш-функции на основе значения ключевого поля этой записи(хеш-поля). Вычисляемый адрес наз. хеш-адресом. Данный метод требует заранее резервировать место на диске для размещения файла БД (это явл.недостатком.)

Показателем эффективной  стратегии прямого доступа к  записям служит малое время поиска и малое число конфликтов. Лучше  всего это достигается, если используется алгоритм  хеширования, равномерно распределяющий записи по областям записи.

Наилучший метод  сост. в использ.хеш- функции, кот.опред.адрес  хранения записи на основе остатка  от деления значений ключа на размер файла в блоках. В этом случае записи файла БД упорядочиваются  по значениям ключевого поля.

Два способа  решения проблем конфликтов.

  1. Запись, для кот.вычисляемый хеш-адрес занят, помещается  в область переполнения файла БД.
  2. Запись, вступившая в конфликт, помещается а некот.свободное место файла, начиная от тек. Занятой позиции.

Использование хеширования в качестве способа адресации записей избавляет от необход.поддерж.и просматр.индексы.Этот медот испльз.когда необход. Быстро забронировать место в гостинице или предвар.заказать билет.

 

27. Сжатие данных на основе различий

Наиболее распростран.технолог. сжатия на основе различий, когда некоторое  значение заменяется сведениями об его  отличиях от предыд.значения. Один из способов применения этой технологии – удаление повторяющихся символов в начале каждой записи с указанием их кол-ва. Для реализ.такой технол.требуется размещать данные последовательно, т.к. для их распаковки надо иметь значение предыд. данного. Прим. До сжатия: Эколог….Экология……Экологический…….После сжатия: 0 – эколог 6- ия 7 – ческий.

 

28. Иерархическое сжатие 

Иерархическое сжатие – сжатие, при кот.постоянные части записей, логически объединенных в группы, записываются один раз.

Пусть в файле  ПРОДУКТЫ записи упорядочены по возрастанию  значений номера накладной(поляНН) . Тогда группы записей о покупателях, купивших тот или иной продукт, можно сжать в отдельные иерархические записи.  Выдел. 2 части:

  1. постоянную –номер накладной и код покупателя
  2. переменную – данные о продуктах:наименов., кол-во, цена

 

29. Кодирование Хаффмана 

Существует технология сжатия, основанная на кодировании  Хаффмана. Суть этого метода состоит  в кодировании отдельных символов битовыми строками разной длины. Наиболее часто встречающиеся символы  кодируются строками наименьшей длины. При этом код некоторого символа длиной n не должен совпадать с первыми n символами следующего за ним кода другого символа. 

 

 

 

 

 

 

 

 

 

 

 

 

30. Понятие проектирования БД. Требования, предъявляемые к БД 

Проектирование  БД – это процесс создания БД, предназначенный для поддержки  функционирования экономического объекта и способствующей  достижению его целей. Оно представляет собой трудоемкий процесс, требующий совместных усилий аналитиков, проектировщиков и пользователей. При проектировании БД необходимо учитывать тот факт, что  она должна удовлетворять комплексу требований:

  • целостность БД – требование полноты и непротиворечивости данных
  • многократное использование данных
  • быстрый поиск и получение информации по запросам пользователей
  • простота обновления данных
  • минимизация избыточности данных
  • защита данных от несанкционированного доступа, искажения и уничтожения

 

31.ЭТАПЫ  ЖИЗНЕННОГО ЦИКЛА БАЗЫ ДАННЫХ.

Жизненный цикл базы данных (ЖЦБД) –  это процесс  проектирования, реализации и поддержки  базы данных. ЖЦБД состоит из семи этапов:

1) предварительное планирование;

2) проверка осуществимости;

3) определение  требований;

4) концептуальное  проектирование;

5) логическое  проектирование;

6) физическое  проектирование;

7) оценка работы  и поддержка базы данных.

Описание.1. Предварительное планирование базы данных – важный этап в процессе перехода от разрозненных данных к интегрированным. На этом этапе собирается информация об используемых и находящихся в процессе разработки прикладных программах и файлах, связанных с ними. Она помогает установить связи между текущими приложениями и то, как используется их информация. Кроме того, позволяет определить будущие требования к базе данных. Информация документируется в виде обобщенной концептуальной модели данных.

2. Проверка осуществимости  предполагает подготовку отчетов по трем вопросам:

1) есть ли  технология – необходимое оборудование  и программное  обеспечение  – для реализации запланированной  базы данных (технологическая осуществимость);

2) имеются ли  персонал, средства и эксперты  для успешного осуществления плана создания базы данных (операционная осуществимость);

3) окупится ли  запланированная база данных (экономическая  эффективность).

3. Определение  требований:

· цели базы данных;

· информационные потребности различных структурных  подразделений и их руководителей;

· требования к  оборудованию;

· требования к  программному обеспечению.

4. Концептуальное  проектирование. Создаются подробные  модели пользовательских представлений  данных предметной области. Затем  они интегрируются в концептуальную  модель, которая фиксирует все элементы корпоративных данных, подлежащих загрузке в базу данных. Эту модель еще называют концептуальной схемой базы данных.

5. Логическое  проектирование. Осуществляется выбор  типа модели данных. Концептуальная  модель отображается в логическую модель, основанную уже на структурах, характерных для выбранной модели.

6. Физическое  проектирование. Логическая модель  расширяется характеристиками, необходимыми  для определения способов физического  хранения базы данных, типа устройств  для хранения,  методов доступа к данным базы, требуемого объема памяти, правил сопровождения базы данных и др.

7. Оценка и  поддержка базы данных. Оценка  включает опрос пользователей  на предмет выяснения, какие  их информационные потребности  остались неучтенными. При необходимости в спроектированную базу данных вносятся изменения. Пользователи обучаются работе с базой данных. По мере расширения и изменения потребностей бизнеса поддержка базы данных обеспечивается путем внесения изменений, добавления новых данных, разработки новых прикладных программ, работающих с базой данных.

 

32.МОДЕЛЬ  «СУЩНОСТЬ-СВЯЗЬ»,ЕЕ ПОНЯТИЯ:СУЩНОСТЬ,АТРИБУТ,ЭКЗЕМПЛЯР  СУЩНОСТИ,СВЯЗЬ,МОЩНОСТЬ СВЯЗИ.ПРЕДСТАВЛЕНИЕ  СУЩНОСТИ И СВЯЗИ НА ER-ДИАГРАММЕ.

Средством моделирования  предметной области на этапе концептуального проектирования является модель "сущность–связь". Часто ее называют ER-моделью (Entity – сущность, Relation – связь). В ней моделирование структуры данных предметной области базируется на использовании графических средств – ER-диаграмм (диаграмм "сущность–связь"). В наглядном виде они представляют связи между сущностями.

Основные понятия ER-диаграммы  – сущность, атрибут, связь.

Сущность –  это некоторый объект реального  мира, который может существовать независимо. Сущность имеет экземпляры, отличающиеся друг от друга значениями атрибутов и допускающие однозначную идентификацию. Атрибут – это свойство сущности. Например, сущность КНИГА характеризуется такими атрибутами, как автор, наименование, цена, издательство, тираж, количество страниц. Конкретные книги являются экземплярами сущности КНИГА. Они отличаются значениями указанных атрибутов и однозначно идентифицируются атрибутом "наименование". Атрибут, который уникальным образом идентифицирует экземпляры сущности, называется ключом. Может быть составной ключ, представляющий комбинацию нескольких атрибутов.

Информация о работе Шпаргалка по "Технологии баз данных"