Резервное копирование и архивация. Назначение. Обратимые и необратимые методы сжатия данных

Автор работы: Пользователь скрыл имя, 25 Ноября 2012 в 21:00, курсовая работа

Краткое описание

Целью контрольно-курсовой работы является изучение резервного копирования и архивации. Назначение. Обратимые и необратимые методы сжатия данных. Основные алгоритмы сжатия данных.
Для достижения указанной цели в работе ставятся следующие задачи:
1. Рассмотреть резервное копирование и архивация;
2. Изучить обратимые и необратимые методы сжатия данных;
3. Выявить основные алгоритмы сжатия данных.

Содержание

Введение 3
1. Резервное копирование и архивация 5
2. Обратимые и необратимые методы сжатия данных 13
3. Основные алгоритмы сжатия данных 15
Заключение 24
Список литературы

Вложенные файлы: 1 файл

Резервное копирование и архивация. Назначение. Обратимые и необратимые методы сжатия данных. Основные алгоритмы сжатия данных.” .doc

— 1.34 Мб (Скачать файл)

Министерство образования  и науки Российской Федерации

Федеральное государственное бюджетное образовательное

учреждение высшего  профессионального образования 

«Тульский государственный  университет»

 

Кафедра «Финансы и менеджмент»

 

 

 

 

Контрольно-Курсовая работа

 

По дисциплине Информационные Таможенные Технолонии

На тему: “Резервное копирование и архивация. Назначение. Обратимые и необратимые методы сжатия данных. Основные алгоритмы сжатия данных.”

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тула 2012

 

 

Содержание

 

 

 

 

 Введение

Какая из обязанностей сетевого и системного администратора самая  неприятная и неинтересная? По мнению многих, таковой является обеспечение непрерывного цикла резервного копирования и архивирования данных. Резервное копирование — это, так сказать, серые будни администратора.

Немало администраторов  пускают резервное копирование  на самотек, производя его от случая к случаю в надежде на авось. Действительно, зачем напрягаться каждый день, если техника работает надежно. Аварии происходят не чаще одного-двух раз в год, а то и реже. Тем не менее, когда это случается (а надо сказать, авария так же неизбежна, как смена года, хотя ее и нельзя предсказать заранее), администратор горько сожалеет (хотя бы про себя), что он своевременно не провел резервное копирование, и обычно дает себе зарок со следующего понедельника осуществлять резервное копирование регулярно. Но спустя некоторое время, когда ситуация нормализуется, он забывает о тяжелых испытаниях, и все опять возвращается на круги своя.

Проблему усугубляет то обстоятельство, что большинство  руководителей предприятий не отдают себе отчета в важности резервного копирования и архивирования данных. Более того, они не хотят прислушиваться к доводам специалистов. Выбить у начальства серьезное программно-аппаратное обеспечение в состоянии только системный администратор с железными нервами и мертвой хваткой. Все остальные вынуждены использовать самое простое (и, соответственно, самое неудобное) обеспечение, из-за чего у администратора возникает множество дополнительных забот, таких, например, как ручная смена картриджей или ежедневное составление расписания резервного копирования. Разумеется, это не добавляет администраторам энтузиазма для организации надлежащей схемы резервного копирования и архивирования данных.

Несмотря на такие  особенности, тема резервного копирования  и архивирования всегда вызывала и вызывает повышенный интерес у администраторов. Они прекрасно понимают, что рано или поздно этими вопросами все равно придется заниматься всерьез.

Целью контрольно-курсовой работы является изучение резервного копирования и архивации. Назначение. Обратимые и необратимые методы сжатия данных. Основные алгоритмы сжатия данных.

Для достижения указанной  цели в работе ставятся следующие  задачи:

1. Рассмотреть резервное копирование и архивация;

2. Изучить обратимые  и необратимые методы сжатия  данных;

3. Выявить основные алгоритмы сжатия данных.

 

 

 

1. Резервное копирование и архивация

Прежде чем говорить об особенностях и возможностях различных  программных продуктов, во избежание возможной путаницы хотелось бы остановиться на терминологии, применяемой при хранении информации на внешних носителях (так называют магнитные ленты, CD-R, магнитооптические диски, DVD-RAM и т. д.).

1. Резервное  копирование (backup). Как следует из названия, резервное копирование предназначено для хранения информации на внешних носителях с тем, чтобы ее можно было восстановить при авариях или сбоях в информационных системах. Например, в случае выходя из строя винчестера операционную систему можно восстановить с резервной копии. В англоязычной литературе процедура восстановления обозначается как restore или recovery.

2. Архивирование  (archive). Архивирование призвано обеспечить долгосрочное сохранение наработанной информации. Часто такая информация уже не требуется для текущей работы, но тем не менее может понадобиться для получения справки, для сверки, проверки или в качестве исходной для какой-то будущей разработки. Например, архивированию подлежит бухгалтерская документация или законченные проекты. Процедура восстановления данных из архива называется разархивированием, или извлечением (retrieve).

3. Системы иерархического хранения данных (Hierarchical Storage Management, HSM). Внешние накопители могут быть использованы для оперативного и интерактивного хранения информации, аналогично тому, как используются винчестеры. В системах HSM медленные, но емкие внешние накопители могут выступать в качестве второго (магнитооптика) или третьего (магнитные ленты) уровня хранения. Файлы, к которым пользователи давно не обращались, переносятся (мигрируют) с винчестеров на накопители второго или третьего уровня. При обращении файл снова автоматически перемещается на винчестер.

Ввиду специфики систем HSM, в данном обзоре они рассматриваться  не будут; читатели могут подробно ознакомиться с характеристиками HSM в статье «Иерархическое хранение данных» в апрельском номере LAN за 1999 год.

Хотя резервное копирование  и архивирование опираются на одни и те же принципы, и, более того, любой программный продукт позволяет  выполнять как функции резервного копирования, так и архивирования, тем не менее они имеют свои особенности.

При резервном копировании целью является сохранение текущего состояния системы, причем предыдущее состояние хранить совершенно необязательно. При архивировании задача состоит в долгосрочном хранении информации, чтобы данные можно было извлечь, даже если они созданы и месяц, и год назад. Нередко архивирование предполагает перенос всех данных при завершении какого-то проекта на внешние носители для освобождения места на винчестерах. Поэтому при архивировании важно выработать надлежащую схему ротации носителей информации с тем, чтобы данные можно было бы не только быстро заархивировать, но и разархивировать, а также чтобы носители содержали полный архив на каждом этапе создания проекта.

Между прочим, резервное  копирование применяется не только для борьбы с неполадками и авариями, но и для тривиального переноса данных с одного диска на другой. Хотя для таких процедур существуют специальные программы, но в ряде случаев применение системы резервирования оказывается удобнее и быстрее.

Несмотря на различия процедур, для удобства администраторы нередко совмещают их, таким образом, внешние носители служат в качестве и резервных копий, и архива. Поэтому в дальнейшем под терминами «хранение» и «копирование» мы будем понимать как резервное копирование, так и архивирование на внешние носители.

Объектами хранения могут  быть файловые системы, каталоги, отдельные  файлы, а также базы данных, включая  системные базы наподобие Novell NDS. Резервное  копирование и архивирование  осуществляются в соответствии с  тремя основными программными методами записи на внешние носители: полным, инкрементальным и дифференциальным.

При полном методе каждый раз производится копирование всего  набора выбранной информации, например копируется целиком файловая система, база данных или отдельный каталог на диске. Данный метод занимает много времени при записи и ведет к большому расходу магнитных лент (или иных носителей). С другой стороны, в этом случае восстановление информации осуществляется быстрее, чем при любом другом методе, для этого требуется только один образ (один набор носителей). Полное копирование является наиболее привлекательным решением при резервном копировании системной информации и служит отправной точкой для других методов.

Инкрементальный метод  представляет собой поэтапный способ записи информации. При таком методе первая запись на ленту является полной копией. При каждой последующей записи на ленту помещаются только модифицированные файлы (т. е. те, у которых изменились содержание, атрибуты или права доступа). По истечении заданного администратором времени цикл повторяется, т. е. опять сначала делается полная копия, а затем инкрементальные копии. С точки зрения копирования на ленту данный метод является самым быстрым и ведет к минимальному расходу магнитной ленты. Однако восстановление информации занимает много времени: информацию сначала требуется восстановить с полной копии, а затем по порядку со всех последующих. Тем не менее это самый популярный метод архивирования и даже резервного копирования, поскольку восстановление/разархивирование — достаточно редкая в информационной среде процедура.

При дифференциальном методе первая запись на ленту также является полной копией. На последующих этапах копируются только измененные со времени  проведения полного копирования файлы. Опять же, после окончания цикла вся процедура вновь начинается с полной копии. При копировании на ленту дифференциальный метод занимает больше времени, чем инкрементальный, но при восстановлении информации требует только две копии: полную и последнюю дифференциальную.

Главной проблемой инкрементального и дифференциального копирования является проблема выбора надежного критерия для установления факта модификации файла. Обычно в качестве такового выступает атрибут Archive (для систем DOS/Windows), время создания/модификации файлов, размер файла или контрольная сумма содержимого файла. К сожалению, все они имеют те или иные недостатки, связанные с особенностями обработки атрибутов и прав доступа отдельными прикладными программами.

Все программы резервного копирования/архивирования можно  условно разделить на три категории.

1. Системы начального уровня, включаемые в состав операционных систем. К ним можно также отнести большинство бесплатных и условно-бесплатных программ резервного копирования. Эти программы не могут похвастаться богатством функциональных возможностей и предназначены для самых тривиальных ситуаций.

2. В настоящее время на рынке доминируют системы среднего уровня, поскольку при относительно невысокой цене они обладают широкими возможностями по резервному копированию и архивированию. Подобных систем множество, наибольшей же известностью среди них пользуются ARCserveIT компании Computer Associates, Backup Exec от Seagate Software и NetWorker компании Legato Systems.

Рис.1. Резервирование данных

3. Системы старшего уровня предназначены для резервного копирования и архивирования в сложных гетерогенных средах. При этом они поддерживают самые разнообразные аппаратные платформы, операционные системы, базы данных и приложения корпоративного уровня. Они имеют прекрасные средства интеграции с системами управления сетью и обеспечивают самые разнообразные аппаратные конфигурации резервного копирования/архивирования. К подобным системам можно отнести ADSM компании IBM и OpenView OmniBack II от Hewlett-Packard. К сожалению, для многих организаций они слишком избыточны и весьма дороги.

За исключением программ начального уровня, все системы резервного копирования/архивирования реализованы в архитектуре клиент-сервер (см. Рисунок 1). Серверный компонент системы резервного копирования/архивирования устанавливается на один из серверов (это может быть NetWare, Windows NT, UNIX, MVS и т. д.). К этому же серверу подключаются внешние накопители, например стримеры или библиотеки магнитных лент. Именно сервер системы резервирования выполняет реальную работу по резервному копированию и архивированию на ленты.

Управление системой осуществляется с консоли системы  резервирования (она может располагаться  как на отдельной машине, так и на сервере системы резервирования — все зависит от конкретной ситуации). На компьютерах, данные с которых подлежат резервному копированию и архивированию, размещаются программные агенты резервирования. Таким образом, один сервер системы резервирования может обслуживать множество компьютеров сети. Агенты способны обеспечить резервирование не только файловых систем, но и баз данных, и специфических приложений наподобие САПР. В первую очередь, агент резервного копирования устанавливают обычно на сервере системы резервирования, хотя это и не обязательно. Некоторые мощные системы резервного копирования и архивирования дают возможность использовать сразу несколько серверов резервирования, причем управление ими осуществляется с одной консоли. С другой стороны, системой резервирования (даже в случае одного сервера) можно управлять и с нескольких консолей.

Один из важных вопросов, который сотрудникам отдела информационных технологий предстоит решить, —  какой вариант построения системы  резервирования лучше использовать: централизованный или децентрализованный. При централизованном подходе все средства резервного копирования и архивирования сосредоточены в одном месте и управляются из единого центра. Соответственно, децентрализованное размещение предполагает, что отдельные подразделения предприятия имеют собственные и независимые средства резервирования данных.

Что лучше? К сожалению, однозначного ответа на этот вопрос нет, все зависит от конкретной ситуации. Плюсом централизованного размещения является то, что оно позволяет значительно снизить затраты на установку и эксплуатацию системы резервного копирования и архивирования. Однако централизованный вариант годится только для случаев, когда все объекты резервного копирования соединены высокопроизводительной сетью. Если счет подлежащих резервированию серверов и рабочих станций идет на десятки и сотни, то это неблагоприятно сказывается на времени, необходимом для резервирования. В этом случае рекомендуется использование сетей устройств хранения (Storage Area Network, SAN), тем более что современные программные и аппаратные средства резервного копирования поддерживают эту технологию.

Децентрализованное размещение — единственно возможный вариант  при наличии филиалов, подключенных по медленным каналам связи.

Рассуждать о том, какая  конкретная система резервного копирования  лучше, а какая хуже — дело бесперспективное, особенно если речь идет о системах среднего и старшего уровня. Многое зависит от того, какие операционные системы, СУБД, распределенные приложения работают в сети, наконец, какую топологию имеет сеть. Поэтому мы не будем останавливаться на возможностях отдельных систем, во всяком случае, отвлеченно от решаемых задач. Каждая из систем имеет свои изюминки и, к сожалению, недостатки. Задача администратора состоит в том, чтобы из всего разнообразия продуктов выбрать тот, который оптимально подходит для его сети. А для этого он должен сформулировать для себя конкретные цели, которых он хочет добиться. Мы же поговорим об общих требованиях, предъявляемых к программным средствам резервного копирования и архивирования.

Информация о работе Резервное копирование и архивация. Назначение. Обратимые и необратимые методы сжатия данных