Автор работы: Пользователь скрыл имя, 12 Марта 2013 в 18:00, шпаргалка
Предметной областью курса «Технологии организации, хранения и обработки данных» является часть реального мира, (это может быть предприятие, его часть, процесс, система и т.д.), которая описывается или моделируется с помощью информационных систем и разрабатываемого программного обеспечения. Информационные системы разного класса и назначения, предназначены для оперирования особо интенсивными потоками информации и олицетворяют собой новую человеко-машинную технологию сбора, обработки, передачи информации.
22.Многомерная
модель данных, ее базовые понятия
(измерение, ячейка),достоинства и недостатки.Многомерная модель-это модель с многомерным логическим
представлением структуры информации.,предназн.для
аналитич.обработки информ.Агрегируемость данных-возможность
их рассмотрения с разл.уровнем обобщения.Историчность-
23.Объемы
современных баз данных и
24.Физический
доступ к базе данных.Технич.специалисты заним.вопросами
физ.организ.БД.Пользователи д.знать проблемы
физ.реализ.БД и способы их реш.Показателем
быстродействия явл.время отклика-промежуток
времени между обращением пользователя
к БД и получением результата.Большое
время отклика не устраив.пользователя.эффект.
25.Индексирование
для ускорения извлечения данных.Для ускорен.доступа к данным
базы по запросам пользователей использ.индексирование
и хеширование.Индекс-это средство
ускорения операций поиска в табл.БД,а
также др.операций,требующих поиска:извлечения,
26. Технология хеширования
Хеширование – технология быстрого прямого доступа к записи БД на основе заданного значения некоторого поля записи, как правило, ключевого. Каждая запись БД размещается по адресу, кот. Вычисляет СУБД с помощью хеш-функции на основе значения ключевого поля этой записи(хеш-поля). Вычисляемый адрес наз. хеш-адресом. Данный метод требует заранее резервировать место на диске для размещения файла БД (это явл.недостатком.)
Показателем эффективной стратегии прямого доступа к записям служит малое время поиска и малое число конфликтов. Лучше всего это достигается, если используется алгоритм хеширования, равномерно распределяющий записи по областям записи.
Наилучший метод сост. в использ.хеш- функции, кот.опред.адрес хранения записи на основе остатка от деления значений ключа на размер файла в блоках. В этом случае записи файла БД упорядочиваются по значениям ключевого поля.
Два способа решения проблем конфликтов.
Использование хеширования в качестве способа адресации записей избавляет от необход.поддерж.и просматр.индексы.Этот медот испльз.когда необход. Быстро забронировать место в гостинице или предвар.заказать билет.
27.
Сжатие данных на основе
Наиболее распростран.технолог.
сжатия на основе различий, когда некоторое
значение заменяется сведениями об его
отличиях от предыд.значения. Один из способов
применения этой технологии – удаление
повторяющихся символов в начале каждой записи с указанием
их кол-ва. Для реализ.такой технол.требуется
размещать данные последовательно, т.к.
для их распаковки надо иметь значение
предыд. данного. Прим. До сжатия: Эколог….Экология……
28. Иерархическое сжатие
Иерархическое сжатие – сжатие, при кот.постоянные части записей, логически объединенных в группы, записываются один раз.
Пусть в файле ПРОДУКТЫ записи упорядочены по возрастанию значений номера накладной(поляНН) . Тогда группы записей о покупателях, купивших тот или иной продукт, можно сжать в отдельные иерархические записи. Выдел. 2 части:
29. Кодирование Хаффмана
Существует технология
сжатия, основанная на кодировании
Хаффмана. Суть этого метода состоит
в кодировании отдельных
30. Понятие проектирования БД. Требования, предъявляемые к БД
Проектирование БД – это процесс создания БД, предназначенный для поддержки функционирования экономического объекта и способствующей достижению его целей. Оно представляет собой трудоемкий процесс, требующий совместных усилий аналитиков, проектировщиков и пользователей. При проектировании БД необходимо учитывать тот факт, что она должна удовлетворять комплексу требований:
31.ЭТАПЫ ЖИЗНЕННОГО ЦИКЛА БАЗЫ ДАННЫХ.
Жизненный цикл базы данных (ЖЦБД) – это процесс проектирования, реализации и поддержки базы данных. ЖЦБД состоит из семи этапов:
1) предварительное планирование;
2) проверка осуществимости;
3) определение требований;
4) концептуальное проектирование;
5) логическое проектирование;
6) физическое проектирование;
7) оценка работы и поддержка базы данных.
Описание.1. Предварительное планирование базы данных – важный этап в процессе перехода от разрозненных данных к интегрированным. На этом этапе собирается информация об используемых и находящихся в процессе разработки прикладных программах и файлах, связанных с ними. Она помогает установить связи между текущими приложениями и то, как используется их информация. Кроме того, позволяет определить будущие требования к базе данных. Информация документируется в виде обобщенной концептуальной модели данных.
2. Проверка осуществимости предполагает подготовку отчетов по трем вопросам:
1) есть ли
технология – необходимое
2) имеются ли персонал, средства и эксперты для успешного осуществления плана создания базы данных (операционная осуществимость);
3) окупится ли запланированная база данных (экономическая эффективность).
3. Определение требований:
· цели базы данных;
· информационные
потребности различных
· требования к оборудованию;
· требования к программному обеспечению.
4. Концептуальное
проектирование. Создаются подробные
модели пользовательских
5. Логическое
проектирование. Осуществляется выбор
типа модели данных. Концептуальная
модель отображается в
6. Физическое
проектирование. Логическая модель
расширяется характеристиками, необходимыми
для определения способов
7. Оценка и
поддержка базы данных. Оценка
включает опрос пользователей
на предмет выяснения, какие
их информационные потребности
остались неучтенными. При
32.МОДЕЛЬ
«СУЩНОСТЬ-СВЯЗЬ»,ЕЕ ПОНЯТИЯ:
Средством моделирования предметной области на этапе концептуального проектирования является модель "сущность–связь". Часто ее называют ER-моделью (Entity – сущность, Relation – связь). В ней моделирование структуры данных предметной области базируется на использовании графических средств – ER-диаграмм (диаграмм "сущность–связь"). В наглядном виде они представляют связи между сущностями.
Основные понятия ER-диаграммы – сущность, атрибут, связь.
Сущность – это некоторый объект реального мира, который может существовать независимо. Сущность имеет экземпляры, отличающиеся друг от друга значениями атрибутов и допускающие однозначную идентификацию. Атрибут – это свойство сущности. Например, сущность КНИГА характеризуется такими атрибутами, как автор, наименование, цена, издательство, тираж, количество страниц. Конкретные книги являются экземплярами сущности КНИГА. Они отличаются значениями указанных атрибутов и однозначно идентифицируются атрибутом "наименование". Атрибут, который уникальным образом идентифицирует экземпляры сущности, называется ключом. Может быть составной ключ, представляющий комбинацию нескольких атрибутов.