Резервирование информации

Автор работы: Пользователь скрыл имя, 13 Марта 2014 в 12:25, реферат

Краткое описание

Цель резервного копирования – обеспечить последующее восстановление при необходимости. Есть множество причин потери данных:
-физический отказ;
-порча данных вследствие хакерской атаки;
-ошибки пользователя;
-природные катаклизмы (при решении с использованием ЦОДа, находящего в другом месте или даже в другом городе);
-ошибки в работе ОС.

Содержание

Введение……………………………………………………………………...3
Резервное копирование через сеть SAN……………………………………3
Резервное копирование NAS ……………………………………………….4
Файловый сервер …………………………………………………………...5
Ленточный накопитель ……………………………………………………..6
Облачные сервисы для хранения данных …………………………………7
Внешние устройства резервирования ……………………………………..8
Резервирование с помощью Raid-массивов ………………………………30
Схемы ротации. Принцип Ханойских башен ……………………………..37
Заключение ………………………………………………………………….38

Вложенные файлы: 1 файл

рефеh.doc

— 741.50 Кб (Скачать файл)

 
Если брать исторический аспект, то данная технология родилась в результате решения проблемы, связанной с нарушением функционирования вычислительного комплекса в результате потерей данных, находящихся в памяти, иными словами решения проблемы отказоустойчивости. Исследованиями занимался Норман Кен Учи, а в 1978 году он защитил свои разработки патентом. 
 
Затем, в 1987 году, Девид Паттерсон, Гарт Гибсон и Рэнди Кац опубликовали статью, где ввели термин "RAID". Данная статья говорила о высокой скорости роста производительности процессоров и грядущей в будущем проблеме с производительностью дисковой подсистемы. Более того, к настоящему моменту рост производительности значительно опередил предсказания, и проблема стала более актуальной. 
 
RAID массивы как раз и призваны повысить производительность дисковой подсистемы. Но ещё одной задачей является снижение зависимости надёжности подсистемы от надёжности диска. То есть, такая организация работы, при которой надёжность выше, чем у одиночного диска. С ростом числа устройств, согласно теории вероятности, значительно падает надёжность системы, но отказоустойчивость призвана бороться с этим. Всё это делается с помощью специальным образом организованной работы массива из жестких дисков.Это и есть RAID. 
 
Что нужно для построения RAID-массива? Прежде всего, RAID-контроллер и, как минимум, два жестких диска (в зависимости от уровня — например, для массива RAID 5 требуется не менее трех HDD). 
 
Принцип функционирования RAID-системы заключается в следующем: из набора дисковых накопителей создается массив, который управляется специальным контроллером и определяется компьютером как единый логический диск большой емкости. За счет параллельного выполнения операций ввода-вывода обеспечивается высокое быстродействие системы, а повышенная надежность хранения информации достигается дублированием данных или вычислением контрольных сумм. Следует отметить, что применение RAID-массивов защищает от потерь данных только в случае физического отказа жестких дисков. 
 
Raid массивы бывают разных типов. Изначально они предназначались для серверов, видимо, поэтому, когда 70% пользователей слышат о Raid массивах, представляют себе Raid-1 массив (зеркалирование). 
 
Различают несколько основных уровней RAID-массивов: RAID 0, 1, 2, 3, 4, 5, 6, 7. Также существуют комбинированные уровни, такие как RAID 10, 0+1, 30, 50, 53 и т.п. Рассмотрим вкратце принципы функционирования, достоинства и недостатки основных уровней.

RAID 0: Несколько дисков объединяются  в незащищенный от сбоев том  с использованием алгоритма чередования (striping). Хотя эта схема похожа  на конкатенацию, она улучшает  производительность и эффективность использования дисков. Основной недостаток striping – это отсутствие возможности восстановления группы дисков RAID 0 при выходе из строя даже одного диска, который приведет к потере всех данных тома. В большинстве решений RAID 0 данные по дискам распределяются по методу round-robin (кругового обслуживания).

 

 

 

RAID 1 (зеркалирование дисков): Группа RAID 1 состоит из двух и более10 физических дисков, содержащих точные дубликаты одних и тех же данных. Настройку и синхронизацию данных на дисках RAID-1 выполняет RAID-контроллер.

RAID 5: Как и в RAID 0 данные”распределяются” по нескольким физическим дискам, на RAID 5 для резервирования используется механизм проверки четности. Имеется несколько разных алгоритмов организации томов RAID 5, но все они гарантируют, что при выходе из строя одного диска тома его данные не будут потеряны, хотя производительность RAID-массива упадет до тех пор, пока неисправный диск не будет заменен на новый . Выход из строя второго диска в RAID-группе приведет к потере данных, поэтому неисправный диск нужно заменить как можно быстрее. Тома RAID 5 даже в обычном режиме (когда нет неисправного диска) работают медленнее, чем другие варианты RAID из-за дополнительной нагрузки, связанной с расчетом и записью битов четности при выполнении каждой операции SCSI

 

 

RAID 6 DP: Как и в RAID 5 данные”распределяются”  по нескольким физическим дискам, на RAID 6 для резервирования используется  механизм проверки двойнойчетности. Данный механизм гарантирует  сохранность данных в случае выхода из строя двух дисков одновременно. Тома RAID 6 в обычном режиме работают как RAID 5.

RAID 1+0; 5+1: Во многих массивах использует  комбинация нескольких уровней RAID, например, можно сконфигурировать  несколько дисков в зеркалированные  пары (RAID 1) и затем объединить эти зеркалированные пары с чередованием в массив RAID 0. Таким образом, достигается сочетание оптимизации производительности RAID 0 с улучшением надежности RAID 1. В зависимости от конкретной реализации такой подход называется RAID 0+1 либо RAID 1+0. Хотя такие решения дороже, чем RAID 5, поскольку требуют больше физической емкости дисков на единицу доступной емкости, они улучшают скорость и надежность. В некоторых случаях можно зеркалировать между собой целые массивы RAID, т.е. каждый массив состоит из одного или нескольких томов RAID 5, которые зеркалируются между массивами. Этот подход популярен для дорогих решений обеспечения непрерывности бизнеса (business continuance, BC), поскольку для защиты от крупных катастроф массивы можно установить в разных городах. В этом случае важно обеспечить резервирование на уровне отдельной площадки чтобы переключение приложений BC между площадками требовалось только в случае выхода из строя всей площадки в результате крупной аварии. 

 

 

 

RAID

0

1 & 1+0

3

5

6 (P+Q)

Описание

Данные записываются на диски чередованием

Данные зеркалируются между дисками

Данные распределены между всеми дисками. Один диск выделяется под контрольные суммы.

Данные распределены между всеми дисками с чередованием контроля четности.

Данные распределены между всеми дисками с чередованием контроля четности на два диска.

Минимальное количество дисков

1

2

3

3

5

Эффективный объем

100%

50%

66.67% to

96.7%

66.67% to

96.7%

60.0% to 93.3%

Приложение

IOPs & MB/s

IOPs

MB/s

IOPs & MB/s

IOPs & MB/s

Преимущества

Высокая производительность и полное использование объема дисков.

Производительность и сохранность данных

Высокая скорость последовательной записи.

Оптимален как для последовательной записи, так и для случайной.

Оптимален как для последовательной записи, так и для случайной. Защищает от выхода из строя 2-х дисков одновременно.

Недостатки

Теряются все данные при выходе одного диска из строя

Удвоенная стоимость дискового пространства

Поддерживает небольшое количество параллельных потоков доступа к данным

Скорость зависит от физических дисков.

Скорость зависит от физических дисков.


 

 

В большинстве аппаратных подсистемах RAID можно сконфигурировать один или несколько дисков как диски “горячего резерва (hot spare)”, которые будут задействованы в случае выхода из строя основного диска из тома RAID 1 или RAID 5 . Это позволяет свести к минимуму то время, когда данные тома могут быть потеряны в случае сбоя еще одного диска, а производительность тома падает. Отметим, что диски горячего резерва имеет смысл использовать для защиты RAID 0 или томов, полученных конкатенацией дисков, только при использовании конфигурации RAID 0+1, т.е. зеркалированием. RAID-массивы – это самый распространенный тип систем хранения, подключаемых к SAN, поскольку они обладают высокой гибкостью конфигураций, производительностью корпоративного класса и поддерживают различные опции обеспечения высокой доступности.

 

СХЕМЫ РОТАЦИИ

Поскольку большинство систем резервного копирования и архивирования рассчитано на работу с магнитными лентами, я остановлюсь лишь на особенностях их работы с этим видом носителей.

Для резервного копирования и, особенно, для архивирования очень важным вопросом является выбор подходящей схемы ротации магнитных лент. Наиболее часто используют следующие схемы:

одноразовое копирование;

простая ротация;

«дед, отец, сын»;

«Ханойская башня»;

«10 наборов».

Одноразовое копирование (custom) является самой простой схемой, поскольку оно вообще не предусматривает ротации лент. Все операции проводятся вручную. Перед копированием администратор задает время начала резервирования, перечисляет файловые системы или каталоги, которые нужно копировать. Эту информацию можно сохранить в базе, чтобы ее можно было использовать снова. При одноразовом копировании чаще всего применяется полное копирование.

Простая ротация подразумевает, что некий набор лент используется циклически. Например, цикл ротации может составлять неделю, когда отдельный носитель выделяется для определенного рабочего дня недели. Полная копия делается в пятницу, а в другие дни — инкрементальные (или дифференциальные) копии. Таким образом, для недельного цикла достаточно иметь пять носителей (если копирование происходит только в рабочие дни, и емкость одного носителя достаточна для копии). После завершения цикла все повторяется сначала, и запись производится на те же самые носители, хотя иногда полные (пятничные) копии сохраняют в качестве архива. Недостаток данной схемы в том, что она не очень хорошо подходит для ведения архива, даже если полные копии сохраняются, поскольку количество носителей в архиве быстро увеличивается. Кроме того, запись (во всяком случае, инкрементальная/дифференциальная) производится на одни и те же носители, что ведет к их значительному износу и, как следствие, увеличивает вероятность отказа.

Схема «дед, отец, сын» (Grandfather, Father, Son) имеет иерархическую структуру и предполагает использование комплекта из трех наборов носителей. Раз в неделю делается полная копия дисков компьютера, ежедневно же проводится инкрементальное (или дифференциальное) копирование. Дополнительно раз в месяц производится еще одно полное копирование. Набор для ежедневного инкрементального копирования называется «сыном», для еженедельного — «отцом», и для ежемесячного — «дедом». Состав ежедневного и еженедельного набора является постоянным и неизменным. В случае ежедневного набора свой носитель (их может быть несколько, если объем информации превышает объем одного носителя) закреплен за каждым рабочим днем (кроме пятницы), а в случае еженедельного набора — за каждой неделей по порядку (т. е. данный набор должен содержать не менее четырех носителей). Ежемесячные носители обычно заново не используются и откладываются в архив. Таким образом, по сравнению с простой ротацией в архиве содержатся только ежемесячные копии плюс последние еженедельные и ежедневные копии. Недостаток данной схемы состоит в том, что в архиве находятся только имевшиеся на конец месяца данные. Как и при схеме простой ротации, ежедневные копии подвергаются значительному износу, в то время как нагрузка на еженедельные копии сравнительно невелика.

Схема «Ханойская башня» призвана устранить некоторые из перечисленных недостатков, но, правда, она имеет свои собственные. Схема построена на применении нескольких наборов носителей, их количество не регламентируется, хотя обычно ограничивается пятью-шестью. Каждый набор предназначен для недельного копирования, как в схеме простой ротации, но без изъятия полных копий. Т. е. отдельный набор включает носитель с полной недельной копией и носители с ежедневными инкрементальными (дифференциальными) копиями. В Таблице 1 приведено расписание для пяти наборов носителей. Каждый следующий по порядку набор используется в два раза реже, чем предыдущий. Таким образом, набор N1 перезаписывается каждые две недели, набор N2 — каждые четыре недели, и т. д. Специфической проблемой схемы «Ханойская башня» является ее излишняя сложность.

Схема «10 наборов», как и следует из названия, рассчитана на использование 10 наборов. Период из 40 недель делится на десять циклов. В течение цикла за каждым набором закреплен один день недели. По прошествии четырехнедельного цикла осуществляется сдвиг номера набора. Иными словами, если в первом цикле за понедельник отвечал набор N1, а за вторник — N2, то во втором цикле за понедельник отвечает набор N2, а за вторник — N3. Такая схема позволяет равномерно распределить нагрузку и, как следствие, износ между всеми носителями.

Схемы «Ханойская башня» и «10 наборов» используются нечасто, так как многие системы резервирования их не поддерживают.

 

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

1 набор

х

 

х

 

х

 

х

 

х

 

х

 

х

 

х

 

х

 

2 набор

 

х

     

х

     

х

     

х

     

х

3 набор

     

х

             

х

           

4 набор

             

х

                   

5 набор

                             

х

   

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ЗАКЛЮЧЕНИЕ

Выбор системы резервного копирования или архивирования далеко не прост. Он предполагает учет множества параметров, связанных как с составом имеющегося на предприятии парка компьютеров и программного обеспечения, так и с возможностями аппаратного обеспечения резервирования и затратами на эксплуатацию всего комплекса резервного копирования. Особое внимание необходимо уделить простоте и удобству восстановления серверов после аварий и сбоев.

Информация о работе Резервирование информации