Чаще
всего предполагается, что узлы разделены
физически (а возможно, и территориально,
хотя в действительности достаточно
того, чтобы они были разделены
логически. Два узла могут даже сосуществовать
на одном и том же физическом компьютере
(в особенности на начальном этапе тестирования).
Главная цель создания распределенных
систем со временем изменялась.
В ранних исследованиях в
основном предполагалась территориальная
распределенность, но в большинстве
первых коммерческих реализаций
предполагалось локальное распределение,
когда несколько узлов размещалось
в одном здании и соединялось с помощью
локальной сети. Однако позже стремительное
распространение глобальных сетей
снова пробудило интерес к использованию
территориального распределения. В любом
случае это не имеет большого значения
с точки зрения системы баз данных — решать
в основном требуется одни и те же технические
(связанные с базами данных) проблемы.
Преимущества
распределенных баз данных. Основная
причина заключается в том, что
сами предприятия обычно уже распределены,
по крайней мере, логически, т.е. разбиты
на подразделения, отделы, рабочие группы
и т.д. Очень часто они распределены
и физически, т.е. разделены на отдельно
расположенные заводы, фабрики, лаборатории
и т.д.
Из
этого следует, что данные также
обычно распределены, поскольку каждая
организационная единица на предприятии
создает и обрабатывает собственные
данные, относящиеся к ее деятельности.
Таким образом, информация предприятия
разбивается на отдельные автономные
части, которые иногда называют островами
информации. А распределенная система
обеспечивает мосты для их соединения
в единое целое. Иначе говоря, распределенная
система позволяет структуре базы данных
отображать структуру предприятия — локальные
данные могут храниться локально, в соответствии
с логической принадлежностью, тогда как
к удаленным данным доступ может осуществляться
по мере необходимости.
Преимущества
подобной распределенной системы
очевидны: эффективность обработки
(данные хранятся в том месте, где доступ
к ним требуется наиболее часто) и расширенные
возможности доступа (при необходимости
с помощью коммуникационной сети можно
получить доступ к данным другого узла).
Пожалуй,
наиболее важным преимуществом распределенных
систем является, как уже было
отмечено, отражение ими структуры
предприятия. Подобным системам свойствен
и ряд недостатков, наиболее
существенным из которых является
повышенная сложность распределенных
систем, по крайней мере, с технической
точки зрения.
Выделяют
несколько типы распределённых баз данных:
- Распределённые
базы данных
- Мультибазы
данных с глобальной схемой. Система мультибаз
данных — это распределённая система,
которая служит внешним интерфейсом для
доступа ко множеству локальных СУБД или
структурируется, как глобальный уровень
над локальными СУБД.
- Федеративные
базы данных. В отличие от мультибаз не
располагают глобальной схемой, к которой
обращаются все приложения. Вместо этого
поддерживается локальная схема импорта-экспорта
данных. На каждом узле поддерживается
частичная глобальная схема, описывающая
информацию тех удалённых источников,
данные с которых необходимы для функционирования.
- Мультибазы
с общим языком доступа — распределённые
среды управления с технологией
«клиент-сервер»
Фундаментальный
принцип создания распределённых баз
данных («правило 0») гласит: Для пользователя
распределённая система должна выглядеть
так же, как нераспределённая система.
Фундаментальный
принцип имеет следствием определённые
дополнительные правила или цели. Таких
целей всего двенадцать:
- Локальная
независимость. Узлы в распределённой
системе должны быть независимы, или автономны.
Локальная независимость означает, что
все операции на узле контролируются этим
узлом.
- Отсутствие
опоры на центральный узел. Локальная
независимость предполагает, что все узлы
в распределённой системе должны рассматриваться
как равные. Поэтому не должно быть никаких
обращений к «центральному» или «главному»
узлу с целью получения некоторого централизованного
сервиса.
- Непрерывное
функционирование. Распределённые системы
должны предоставлять более высокую степень
надёжности и доступности.
- Независимость
от расположения. Пользователи не должны
знать, где именно данные хранятся физически
и должны поступать так, как если бы все
данные хранились на их собственном локальном
узле.
- Независимость
от фрагментации. Система поддерживает
независимость от фрагментации, если данная
переменная-отношение может быть разделена
на части или фрагменты при организации
её физического хранения. В этом случае
данные могут храниться в том месте, где
они чаще всего используются, что позволяет
достичь локализации большинства операций
и уменьшения сетевого трафика.
- Независимость
от репликации. Система поддерживает репликацию
данных, если данная хранимая переменная-отношение —
или в общем случае данный фрагмент данной
хранимой переменной-отношения — может
быть представлена несколькими отдельными
копиями или репликами, которые хранятся
на нескольких отдельных узлах.
- Обработка
распределённых запросов. Суть в том, что
для запроса может потребоваться обращение
к нескольким узлам. В такой системе может
быть много возможных способов пересылки
данных, позволяющих выполнить рассматриваемый
запрос.
- Управление
распределёнными транзакциями. Существует 2 главных
аспекта управления транзакциями: управление
восстановлением и управление параллельностью
обработки. Что касается управления восстановлением,
то чтобы обеспечить атомарность транзакции
в распределённой среде, система должна
гарантировать, что все множество относящихся
к данной транзакции агентов (агент — процесс,
который выполняется для данной транзакции
на отдельном узле) или зафиксировало
свои результаты, или выполнило откат.
Что касается управления параллельностью,
то оно в большинстве распределённых систем
базируется на механизме блокирования,
точно так, как и в нераспределённых системах.
- Аппаратная
независимость. Желательно иметь возможность
запускать одну и ту же СУБД на различных
аппаратных платформах и, более того, добиться,
чтобы различные машины участвовали в
работе распределённой системы как равноправные
партнёры.
- Независимость
от операционной
системы. Возможность
функционирования СУБД под различными
операционными системами.
- Независимость
от сети. Возможность поддерживать много
принципиально различных узлов, отличающихся
оборудованием и операционными системами,
а также ряд типов различных коммуникационных
сетей.
- Независимость
от типа СУБД. Необходимо, чтобы экземпляры
СУБД на различных узлах все вместе поддерживали
один и тот же интерфейс, и совсем необязательно,
чтобы это были копии одной и той же версии
СУБД.
Список
литературы
- Дейт К. Дж.
Введение в системы баз данных, 6-е изд.:
Пер. с англ. – К., М., СПб.: Издательский
дом «Вильямс», 2000. – 848 с.
- Хомоненко
А.Д. Цыганков В.М. Базы данных: Учебник
для вузов /Под ред. А.Д. Хомоненко. – М.:
Корона, 2000. – 421 с.
- Информационные
технологии управления: Учебное пособие
/ Под ред. Ю.М. Черкасова. — М.: ИНФРА-М,
2001. — 216 с.
37. Централизованная
и децентрализованная
обработка данных.
Современное
производство требует высоких скоростей
обработки информации, удобных форм
ее хранения и передачи. Необходимо
также иметь динамичные способы
обращения к информации, способы
поиска данных в заданные временные интервалы;
реализовывать сложную математическую
и логическую обработку данных. Управление
крупными предприятиями, управление экономикой
на уровне страны требуют участия в этом
процессе достаточно крупных коллективов.
Такие коллективы могут располагаться
в различных районах города, в различных
регионах страны и даже в различных странах.
Для решения задач управления, обеспечивающих
реализацию экономической стратегии,
становятся важными и актуальными скорость
и удобство обмена информацией, а также
возможность тесного взаимодействия всех
участвующих в процессе выработки управленческих
решений.
К
настоящему времени сложились две
основные формы организации обработки
информации и использования технических
средств - централизованная и частично
или полностью децентрализованная.
Централизованная
обработка информации и использования
технических средств базируется на сосредоточении
вычислительных ресурсов информационных
систем в едином центре (чаще всего это
большие ЭВМ и вычислительные комплексы),
которые обрабатывают в нем информацию,
а затем передают результаты пользователям.
Достоинства
централизации:
- возможен
сильный контроль за информационной системой
и ее обслуживанием;
- информационные
ресурсы располагаются централизованно;
- данные и
затраты на их создание не дублируются;
- имеется возможность
обращения пользователя к большим массивам
информации; разделение данных в организации;
- используются
очень опытные специалисты для работы
с информационной системой в центральном
вычислительном центре;
- имеется возможность
управления большими и сложными проектами;
- хорошие возможности
для объединения и стандартизации;
- легкость
внедрения методологических решений по
развитию и совершенствованию информационной
технологии.
- Недостатки
централизованной организации информационной
системы:
- функции информационной
системы должны появляться из реальных
потребностей бизнеса, а не из задач саморазвития
информационной системы;
- информационные
услуги не нацелены на персональное обслуживание.
Пользователи рассматриваются как покупатели
услуг, отсюда - ограничение возможностей
пользователя в процессе получения и использования
информации;
- большие трудности
в планировании информационных услуг
и использовании информационных ресурсов;
- могут быть
большими затраты на содержание информационной
системы, чем в децентрализованном случае;
- ограничена
ответственность и мотивация персонала
информационной системы, что не способствует
оперативному получению информации пользователем.
Централизованный
подход к организации информационной
системы лучше всего применять, если:
- существует
необходимость полного контроля за информационной
системой;
- организация
мала;
- в информационной
системе используются очень дорогие ресурсы
либо использование ресурсов ограничено;
- различные
подразделения организации имеют похожие
или одинаковые потребности, используются
похожие операции;
- имеет место
монолитная организация с централизованным
автократическим подходом к управлению;
- централизация
является жизненной необходимостью.
Децентрализация
обработки информации и использования
технических средств предполагает реализацию
функциональных подсистем и осуществление
обработки информации непосредственно
на рабочих местах. В большинстве случаев
технической основой децентрализованной
обработки информации являются персональный
компьютер и средства телекоммуникаций.
Достоинствами
децентрализованной организации информационной
системы являются:
- информационные
системы более интегрированы с бизнесом
и лучше отвечают деловым потребностям,
данные расположены близко к пользователям,
пользователи хорошо понимают информацию;
- гибкость
структуры, обеспечивающая простор инициативам
пользователя, у пользователей гораздо
больше автономии;
- уменьшаются
телекоммуникационные затраты;
- системы меньше
и проще, поэтому ими проще управлять,
создавать и поддерживать, уменьшается
централизованный контроль;
- цели использования
ресурсов и усилий могут быть тщательно
продуманы;
- усиление
ответственности низшего звена сотрудников.
- Недостатки
децентрализованной организации информационной
системы:
- потенциальное
дублирование ресурсов;
- возможность
неэффективного использования информационных
ресурсов;
- большие проблемы
с совместимостью и стандартизацией ресурсов
из-за большого числа уникальных разработок;
- трудности
с созданием и использованием сложных
систем реализацией проектов;
- проблемы
в управлении системами и проектами между
подразделениями;
- неравномерность
развития уровня информационной культур
и уровня автоматизации в разных подразделениях,
нет мест для специалистов с большим опытом,
так как общий уровень знаний и навыков
меньше;
- психологическое
неприятие пользователями, рекомендуемы
централизованно стандартов и готовых
программных продуктов.
Децентрализованный
подход к организации информационной
системы лучше всего применять,
если:
- организация
значительна по размерам;
- децентрализация
поддерживается органами управления;
- существует
потребность в скорости и гибкости информационного
обслуживания;
- применяются
различные операции, сервис уникален для
одной части организации и должен контролироваться
этим под разделением;
- имеет место
организация с заданными подразделениями,
которой активно используют мотивацию
сотрудников и подразделений, делегирование
полномочий;
- имеется связь
между производительностью и децентрализацией.
В
качестве гибрида этих двух способов организации
информационной системы используют частично
децентрализованный подход. В этом случае
имеется и мощный вычислительный центр
(общая стратегия, обучение, помощь, стандарты
и политика применения программных и технических
средств), и локальные вычислительные
ресурсы, объединенные в сеть.
Список
литературы
- Дейт К. Дж.
Введение в системы баз данных, 6-е изд.:
Пер. с англ. – К., М., СПб.: Издательский
дом «Вильямс», 2000. – 848 с.
- Информатика:
Учебник / Под ред. Н.В. Макаровой. - M: Финансы
и статистика, 1997. - 768 с.
- Саак А. Э.,
Пахомов Е. В., Тюшняков В. Н. Информационные
технологии управления: Учебник для вузов.
— СПб.: Питер, 2005. — 320 с