Рейд массив 5

Создаём рейд массив на основе встроенного контроллера

Как я говорил выше, Ваша материнская плата должна поддерживать создание RAID’а. Представленная ниже инструкция актуальна для ASUS-плат на основе UEFI-биоса, но общий принцип схож как таковой, посему к ознакомлению мануал всё же рекомендуется всем.

Для начала заходим в BIOS, используя соответствующую клавишу (как правило DEL), а там находим раздел отвечающий за параметры для SATA-контроллера (надеюсь, что IDE уже нигде не используется).

Где переключаем положение контроллера в RAID (обычно там стоит ACHI). Напоминаю, что диски в идеале должны быть идентичны (желательно абсолютно, а не только размерами). Далее, собственно, перезагружаемся, предварительно сохранив в BIOS изменения.

На этапе инициализации дисков, т.е еще до загрузки операционной системы, будет необходимо нажать, как правило (но не всегда) CTRL-F или CTRL-I. В общем, следите внимательно, ибо обычно оно показывает какое сочетание клавиш необходимо тыкнуть (бывают еще всякие F1-F12).

Простейшее меню можно лицезреть на скриншоте выше. Ничего сложного оно из себя не представляет и условно выглядит следующим образом:

  • View Drive Assignments, — показывает диски, что пригодны для создания массива;
  • LD View / LD Define Menu, — показывает текущие массивы;
  • Delete LD Menu, — позволяет удалять массивы;
  • Controller Configuration, — собственно, отвечает непосредственно за настройки.

Нас, в рамках создания такой штуки как рейд массив, собственно, нас интересует только второй пункт. Нажав на соответствующую кнопку на клавиатуре (т.е цифру 2) попадаем в соответствующее меню.

Здесь мы можем увидеть текущие массивы (собственно, они видны на скриншоте), взглянуть на их настройки (Enter), посмотреть на диски вне RAID (Ctrl+V) или, скажем, создать новые рейды (Ctrl+C). Нас интересует создание, а посему жмём в соответствующее сочетание клавиш.

Далее мы будем наблюдать меню для создания RAID-а (сверху) и сами одинокие (вне массивов) диски (внизу). Параметры переключаются пробелом, сами пункты параметров меняются стрелками клавиатуры.

Напоминаю, что 1-ый рейд — это «зеркало», т.е диски дублируют друг друга и даже, если один выходит из строя, то на втором остаётся полная копия данных.

0-вой же отвечает за производительность, т.е оба диска работают в паре для достижения максимально доступной скорости чтения-записи. Более подробно я расписывал всё по ссылке, что давал в самом начале статьи.

Дальнейшие шаги по созданию

На скриншоте выше задано всё необходимое для создания RAID 1 (зеркало), хотя и задавать там особо было нечего: все параметры оставлены по умолчанию, выбран тип рейда и указаны два диска-терабайника (Y в колонке Assingment). На этом всё. Я не хочу сейчас вдаваться в детали всех параметров, ибо это тема для отдельной статьи (кратенько я касался этого с практической стороны на sonikelf.name).

Задав всё необходимое жмём в CTRL-Y. Далее либо жмём любую кнопку (задаст имя по умолчанию), либо повторяем нажатие CTRL-Y, чтобы задать имя самостоятельно. Я выбрал второй путь:

На следующем этапе, в связи с тем, что мы выбрали стандартный параметр быстрой инициализации появиться предупреждение о том, что данные с дисков будут удалены. Жмём CTRL-Y, если уверены, что ничего на дисках Вам необходимого нет.

На последнем этапе будет предложено выбрать размер, что будет отводиться под рейд массив или занять всё доступное место на дисках. Я выбрал в данном пункте решение занять всё место на дисках (что, к слову, рекомендую и Вам), путём нажатия любой кнопки на клавиатуре.

На этом создания RAID-а можно считать завершенным, остаётся лишь выйти из мастера и перезагрузить компьютер.

А, и да, не забудьте, при необходимости, зайти в мастер управления дисками и провести инициализацию и распределения места на новосозданном RAID-массиве. Мастер живет по пути «Панель управления — Администрирование — Управление компьютером — Управление дисками».

Ну и, собственно, распределение места, т.е создание разделов, тоже проблем особо не доставляет и выполняется стандартным образом:

А и, да, драйвера для такой штуки как рейд массив полезно будет установить, если конечно они не стоят у Вас уже давно. Драйвера берутся с диска к мат.плате или с сайта производителя этой мат.платы.

На сим, пожалуй, всё.

Послесловие

Вот такие дела. Кратенько, быстро и наглядно (хотя, признаю, что фотографии не самые удачные, но снимать скриншоты эмулятором или на зеркалку как-то не с руки, ведь, в данном случае, таки главное суть), зато теперь Вы можете быстро собрать рейд массив.

Виды RAID и их характеристики

Что такое RAID мы рассмотрели в первой статье. Теперь посмотрим какие есть виды и чем они отличаются.

Калифорнийский университет в Беркли представил следующие уровни спецификации RAID, которые были приняты как стандарт де-факто:

  • RAID 0 — дисковый массив повышенной производительности с чередованием, без отказоустойчивости;
  • RAID 1 — зеркальный дисковый массив;
  • RAID 2 зарезервирован для массивов, которые применяют код Хемминга;
  • RAID 3 и 4 — дисковые массивы с чередованием и выделенным диском чётности;
  • RAID 5 — дисковый массив с чередованием и «невыделенным диском чётности»;
  • RAID 6 — дисковый массив с чередованием, использующий две контрольные суммы, вычисляемые двумя независимыми способами;
  • RAID 10 — массив RAID 0, построенный из массивов RAID 1;
  • RAID 50 — массив RAID 0, построенный из массивов RAID 5;
  • RAID 60 — массив RAID 0, построенный из массивов RAID 6.

Виды RAID и их характеристики

Аппаратный RAID-контроллер может поддерживать несколько разных RAID-массивов одновременно, суммарное количество жёстких дисков которых не превышает количество разъёмов для них. При этом контроллер, встроенный в материнскую плату, в настройках BIOS имеет всего два состояния (включён или отключён), поэтому новый жёсткий диск, подключённый в незадействованный разъём контроллера при активированном режиме RAID, может игнорироваться системой, пока он не будет ассоциирован как ещё один RAID-массив типа JBOD (spanned), состоящий из одного диска.

RAID 5

Основным недостатком уровней RAID от 2-го до 4-го является невозможность производить параллельные операции записи, так как для хранения информации о чётности используется отдельный контрольный диск. RAID 5 не имеет этого недостатка. Блоки данных и контрольные суммы циклически записываются на все диски массива, нет асимметричности конфигурации дисков. Под контрольными суммами подразумевается результат операции XOR (исключающее или). Xor обладает особенностью, которая даёт возможность заменить любой операнд результатом, и, применив алгоритм xor, получить в результате недостающий операнд. Например: a xor b = c (где a, b, c — три диска рейд-массива), в случае если a откажет, мы можем получить его, поставив на его место c и проведя xor между c и b: c xor b = a. Это применимо вне зависимости от количества операндов: a xor b xor c xor d = e. Если отказывает c тогда e встаёт на его место и проведя xor в результате получаем c: a xor b xor e xor d = c. Этот метод по сути обеспечивает отказоустойчивость 5 версии. Для хранения результата xor требуется всего 1 диск, размер которого равен размеру любого другого диска в raid.

Достоинства

RAID5 получил широкое распространение, в первую очередь, благодаря своей экономичности. Объём дискового массива RAID5 рассчитывается по формуле (n-1)*hddsize, где n — число дисков в массиве, а hddsize — размер наименьшего диска. Например, для массива из четырех дисков по 80 гигабайт общий объём будет (4 — 1) * 80 = 240 гигабайт. На запись информации на том RAID 5 тратятся дополнительные ресурсы и падает производительность, так как требуются дополнительные вычисления и операции записи, зато при чтении (по сравнению с отдельным винчестером) имеется выигрыш, потому что потоки данных с нескольких дисков массива могут обрабатываться параллельно.

Недостатки

Производительность RAID 5 заметно ниже, в особенности на операциях типа Random Write (записи в произвольном порядке), при которых производительность падает на 10-25% от производительности RAID 0 (или RAID 10), так как требует большего количества операций с дисками (каждая операция записи, за исключением так называемых full-stripe write-ов, сервера заменяется на контроллере RAID на четыре — две операции чтения и две операции записи). Недостатки RAID 5 проявляются при выходе из строя одного из дисков — весь том переходит в критический режим (degrade), все операции записи и чтения сопровождаются дополнительными манипуляциями, резко падает производительность. При этом уровень надежности снижается до надежности RAID-0 с соответствующим количеством дисков (то есть в n раз ниже надежности одиночного диска). Если до полного восстановления массива произойдет выход из строя, или возникнет невосстановимая ошибка чтения хотя бы на еще одном диске, то массив разрушается, и данные на нем восстановлению обычными методами не подлежат. Следует также принять во внимание, что процесс RAID Reconstruction (восстановления данных RAID за счет избыточности) после выхода из строя диска вызывает интенсивную нагрузку чтения с дисков на протяжении многих часов непрерывно, что может спровоцировать выход какого-либо из оставшихся дисков из строя в этот наименее защищенный период работы RAID, а также выявить ранее не обнаруженные сбои чтения в массивах cold data (данных, к которым не обращаются при обычной работе массива, архивные и малоактивные данные), что повышает риск сбоя при восстановлении данных.

Минимальное количество используемых дисков равно трём.

RAID 5

RAID 10 (1+0)

RAID 10 — зеркалированный массив, данные в котором записываются последовательно на несколько дисков, как вRAID 0. Эта архитектура представляет собой массив типа RAID 0, сегментами которого вместо отдельных дисков являются массивы RAID 1. Соответственно, массив этого уровня должен содержать как минимум 4 диска (и всегда чётное количество). RAID 10 объединяет в себе высокую отказоустойчивость и производительность.

Утверждение, что RAID 10 является самым надёжным вариантом для хранения данных вполне обосновано тем, что массив будет выведен из строя после выхода из строя всех накопителей в одном и том же массиве. При одном вышедшем из строя накопителе, шанс выхода из строя второго в одном и том же массиве равен 1/3*100=33%. RAID 0+1 выйдет из строя при двух накопителях, вышедших из строя в разных массивах. Шанс выхода из строя накопителя в соседнем массиве равен 2/3*100=66%, однако так как накопитель в массиве с уже вышедшим из строя накопителем уже не используется, то шанс того, что следующий накопитель выведет из строя массив целиком равен 2/2*100=100%

RAID 1 (Mirror)

RAID 0, RAID 1, RAID 5, RAID6, RAID 10 или что такое уровни RAID?

© Андрей Егоров, 2005, 2006. Группа компаний ТИМ.

Посетители форума задают нам вопрос: «Какой уровень RAID самый надежный?» Все знают, что наиболее распространенным является уровень RAID5, однако он отнюдь не лишен серьезных недостатков, которые неочевидны для неспециалистов.

В своей статье я попытаюсь охарактеризовать самые популярные уровни RAID, а затем сформулирую рекомендации по использованию этих уровней. Для иллюстрации статьи я построил диаграмму, на которой поместил эти уровни в трехмерном пространстве надежности, производительности и ценовой эффективности.

Редакция 2010 года:

Экономичность. Следует пояснить, что под экономичностью мы подразумеваем в данном случае коэффициент использования пространства жёстких дисков. Для уровней JBOD и RAID0 он равен единице, для «зеркальных» уровней RAID1x равен 1/2, а для всех других вычисляется по формуле (N-X)/N, где X=1 для RAID5, Х=2 для RAID5EE и RAID6. При наличии диска (дисков) горячего резерва HotSpare значение X следует увеличить ещё на количество таких дисков.

Поясню на примере. Для внешней системы хранения данных ProStor® M-6160FA-512, имеющей в составе 16 жёстких дисков, 15 из которых объединены в RAID6, а ещё один объявлен как HotSpare, коэффициент использования будет (16–2–1)/16, то есть 81%. Для массива RAID0 на той же стойке этот коэффициент будет равен 100%, а для RAID1 – 50%. Естественно, ни о какой дешевизне в таком контексте речи быть не может, поэтому не следует анализировать нашу диаграмму на предмет поиска самых бюджетных вариантов.

Раз уж об этом зашла речь, «RAID для бедных» – это, как правило, программные реализации RAID0, RAID1, RAID10, RAID5 на двух, четырёх, максимум — шести дисках. Они чаще всего применяются в домашних станциях и не слишком критических серверных задачах и, конечно, тоже имеют право на существование.

Кстати, термин RAID, предложенный учеными Калифорнийского Университета Беркли в 1987 году, первоначально расшифровывался как Redundant Array of Inexpensive Disks (избыточный массив недорогих дисков). В последующем его изменили на Redundant Array of Independent Disks (избыточный массив независимых дисков) – это более точно отражает его суть и не вводит в заблуждение насчёт стоимости, так как для работы в массиве, естественно, рекомендуется использовать аппаратный контроллер и самые качественные диски, которые дешёвыми не являются.

Скорость. Практически безальтернативным средством долговременного хранения больших объёмов данных до недавнего времени являлись магнитные жесткие диски. Магнитные ленты, различные оптические и магнито-оптические дисковые технологии и флэшки в силу присущих им специфических ограничений составить им конкуренцию не могли. Достойным соперником в будущем могут стать твердотельные диски SSD, но их время ещё не наступило (технологию SSD обсудим чуть позже)).

Итак, «узким» местом любой компьютерной системы являются скоростные характеристики механических частей жёстких дисков: скорость вращения шпинделя и среднее время позиционирования головок. От первой характеристики (при её умножении на плотность записи) зависит так называемая внутренняя скорость чтения и записи данных. От второй – степень затрат времени на перемещение головок, во время которого, естественно, ни запись, ни чтение не производятся.

Реальными путями увеличения производительности дисковой подсистемы, очевидно, являются: минимизация перемещения головок накопителей и параллельное чтение данных с нескольких накопителей одновременно. На практике первый путь реализуется увеличением размера кластера операционной системы, оптимизацией размещения данных на диске и регулярной дефрагментацией. Для реализации второго пути в 1987 было разработано описание набора архитектур массивов дисков, отличающихся отказоустойчивостью и повышенной производительностью, получившее название RAID.

Самыми быстрым согласно нашей диаграмме является уровень RAID0 (RAID00). Теоретически, производительность такого массива должна расти линейно по мере увеличения числа входящих в него дисков, однако на практике, конечно же, всё обстоит не настолько радужно. К тому же следует помнить, что с увеличением числа входящих в RAID0 дисков скорость растёт арифметически, а вероятность отказа – геометрически. В некотором роде компромиссом скорости и надёжности являются все уровни RAIDx0, среди которых упомянем RAID10, RAID1E0, RAID50 и RAID60.

Надёжность. Стопроцентной надежности не бывает в принципе, поэтому в данном случае мы будем рассматривать уровни RAID с точки зрения их устойчивости к отказам отдельных дисков. В этом смысле самым «ненадежным», как мы только что выяснили, является самый быстрый уровень RAID0. Выход из строя любого жёсткого диска в массиве RAID0 вызывает полную потерю его данных.

Самыми надёжными на сегодняшний день можно считать уровни RAID6 и RAID15. В любом случае, не следует забывать про резервное копирование.

© Все права на материал принадлежат автору (Андрей Егоров, ЗАО «ТИМ», 2005, 2006, 2010).
Перепечатка и использование возможны только с письменного разрешения автора
или при наличии активной ссылки на сайт www.timcompany.ru!

JBOD (Just a Bunch of Disks) – это простое объединение (spanning) жестких дисков, которое уровнем RAID формально не является. Томом JBOD может быть массив из одного диска или объединение нескольких дисков. Контроллеру RAID для работы с таким томом не требуется проведение каких-либо вычислений. На нашей диаграмме диск JBOD служит в качестве «ординара» или отправной точки – его значения надежности, производительности и стоимости совпадают с соответствующими показателями единичного жесткого диска.

RAID 0 (“Striping”) избыточности не имеет, а информацию распределяет сразу по всем входящим в массив дискам в виде небольших блоков («страйпов»). За счет этого существенно повышается производительность, но страдает надежность. Как и в случае JBOD, за свои деньги мы получаем 100% емкости диска.

Поясню, почему уменьшается надежность хранения данных на любом составном томе – так как при выходе из строя любого из входящих в него винчестеров полностью и безвозвратно пропадает вся информация. В соответствии с теорией вероятностей математически надежность тома RAID0 равна произведению надежностей составляющих его дисков, каждая из которых меньше единицы, поэтому совокупная надежность заведомо ниже надежности любого диска.

Хороший уровень – RAID 1 (“Mirroring”, «зеркало»). Он имеет защиту от выхода из строя половины имеющихся аппаратных средств (в общем случае – одного из двух жестких дисков), обеспечивает приемлемую скорость записи и выигрыш по скорости чтения за счет распараллеливания запросов. Недостаток заключается в том, что приходится выплачивать стоимость двух жестких дисков, получая полезный объем одного жесткого диска.

Изначально предполагается, что жесткий диск – вещь надежная. Соответственно, вероятность выхода из строя сразу двух дисков равна (по формуле) произведению вероятностей, т.е. ниже на порядки! К сожалению, реальная жизнь – не теория! Два винчестера берутся из одной партии и работают в одинаковых условиях, а при выходе из строя одного из дисков нагрузка на оставшийся увеличивается, поэтому на практике при выходе из строя одного из дисков следует срочно принимать меры – вновь восстанавливать избыточность. Для этого с любым уровнем RAID (кроме нулевого) рекомендуют использовать диски горячего резерва HotSpare. Достоинство такого подхода – поддержание постоянной надежности. Недостаток – еще большие издержки (т.е. стоимость 3-х винчестеров для хранения объема одного диска).

Зеркало на многих дисках – это уровень RAID 10. При использовании такого уровня зеркальные пары дисков выстраиваются в «цепочку», поэтому объем полученного тома может превосходить емкость одного жесткого диска. Достоинства и недостатки – такие же, как и у уровня RAID1. Как и в других случаях, рекомендуется включать в массив диски горячего резерва HotSpare из расчета один резервный на пять рабочих.

RAID 5, действительно, самый популярный из уровней – в первую очередь благодаря своей экономичности. Жертвуя ради избыточности емкостью всего одного диска из массива, мы получаем защиту от выхода из строя любого из винчестеров тома. На запись информации на том RAID5 тратятся дополнительные ресурсы, так как требуются дополнительные вычисления, зато при чтении (по сравнению с отдельным винчестером) имеется выигрыш, потому что потоки данных с нескольких накопителей массива распараллеливаются.

Недостатки RAID5 проявляются при выходе из строя одного из дисков – весь том переходит в критический режим, все операции записи и чтения сопровождаются дополнительными манипуляциями, резко падает производительность, диски начинают греться. Если срочно не принять меры – можно потерять весь том. Поэтому, (см. выше) с томом RAID5 следует обязательно использовать диск Hot Spare.

Помимо базовых уровней RAID0 — RAID5, описанных в стандарте, существуют комбинированные уровни RAID10, RAID30, RAID50, RAID15, которые различные производители интерпретируют каждый по-своему.

Суть таких комбинаций вкратце заключается в следующем. RAID10 – это сочетание единички и нолика (см. выше). RAID50 – это объединение по “0” томов 5-го уровня. RAID15 – «зеркало» «пятерок». И так далее.

Таким образом, комбинированные уровни наследуют преимущества (и недостатки) своих «родителей». Так, появление «нолика» в уровне RAID 50 нисколько не добавляет ему надежности, но зато положительно отражается на производительности. Уровень RAID 15, наверное, очень надежный, но он не самый быстрый и, к тому же, крайне неэкономичный (полезная емкость тома составляет меньше половины объема исходного дискового массива).

RAID 6 отличается от RAID 5 тем, что в каждом ряду данных (по-английски stripe) имеет не один, а два блока контрольных сумм. Контрольные суммы – «многомерные», т.е. независимые друг от друга, поэтому даже отказ двух дисков в массиве позволяет сохранить исходные данные. Вычисление контрольных сумм по методу Рида-Соломона требует более интенсивных по сравнению с RAID5 вычислений, поэтому раньше шестой уровень практически не использовался. Сейчас он поддерживается многими продуктами, так как в них стали устанавливать специализированные микросхемы, выполняющие все необходимые математические операции.

Согласно некоторым исследованиям, восстановление целостности после отказа одного диска на томе RAID5, составленном из дисков SATA большого объема (400 и 500 гигабайт), в 5% случаев заканчивается утратой данных. Другими словами, в одном случае из двадцати во время регенерации массива RAID5 на диск резерва Hot Spare возможен выход из строя второго диска… Отсюда рекомендации лучших RAIDоводов: 1) всегда делайте резервные копии; 2) используйте RAID6!

Недавно появились новые уровни RAID1E, RAID5E, RAID5EE. Буква “Е” в названии означает Enhanced.

RAID level-1 Enhanced (RAID level-1E) комбинирует mirroring и data striping. Эта смесь уровней 0 и 1 устроена следующим образом. Данные в ряду распределяются точь-в-точь так, как в RAID 0. То есть ряд данных не имеет никакой избыточности. Следующий ряд блоков данных копирует предыдущий со сдвигом на один блок. Таким образом как и в стандартном режиме RAID 1 каждый блок данных имеет зеркальную копию на одном из дисков, поэтому полезный объем массива равен половине суммарного объема входящих в массив жестких дисков. Для работы RAID 1E требуется объединение трех или более дисков.

Мне очень нравится уровень RAID1E. Для мощной графической рабочей станции или даже для домашнего компьютера – оптимальный выбор! Он обладает всеми достоинствами нулевого и первого уровней – отличная скорость и высокая надежность.

Перейдем теперь к уровню RAID level-5 Enhanced (RAID level-5E). Это то же самое что и RAID5, только со встроенным в массив резервным диском spare drive. Это встраивание производится следующим образом: на всех дисках массива оставляется свободным 1/N часть пространства, которая при отказе одного из дисков используется в качестве горячего резерва. За счет этого RAID5E демонстрирует наряду с надежностью лучшую производительность, так как чтение/запись производится параллельно с бОльшего числа накопителей одновременно и spare drive не простаивает, как в RAID5. Очевидно, что входящий в том резервный диск нельзя делить с другими томами (dedicated vs. shared). Том RAID 5E строится минимум на четырех физических дисках. Полезный объем логического тома вычисляется по формуле N-2.

RAID level-5E Enhanced (RAID level-5EE) подобен уровню RAID level-5E, но он имеет более эффективное распределение spare drive и, как следствие, – более быстрое время восстановления. Как и уровень RAID5E, этот уровень RAID распределяет в рядах блоки данных и контрольных сумм. Но он также распределяет и свободные блоки spare drive, а не просто оставляет под эти цели часть объема диска. Это позволяет уменьшить время, необходимое на реконструкцию целостности тома RAID5EE. Входящий в том резервный диск нельзя делить с другими томами – как и в предыдущем случае. Том RAID 5EE строится минимум на четырех физических дисках. Полезный объем логического тома вычисляется по формуле N-2.

Как ни странно, никаких упоминаний об уровне RAID 6E на просторах Интернета я не нашел — пока такой уровень никем из производителей не предлагается и даже не анонсируется. А ведь уровень RAID6E ( или RAID6EE? ) можно предложить по тому же принципу, что и предыдущий. Диск HotSpare обязательно должен сопровождать любой том RAID, в том числе и RAID 6. Конечно, мы не потеряем информацию при выходе из строя одного или двух дисков, но начать регенерацию целостности массива крайне важно как можно раньше, чтобы скорее вывести систему из «критического» режима. Поскольку необходимость диска Hot Spare для нас не подлежит сомнению, логичным было бы последовать дальше и «размазать» его по тОму так, как это сделано в RAID 5EE, чтобы получить преимущества от использования бОльшего количества дисков (лучшая скорость на чтении-записи и более быстрое восстановление целостности).

Все «зеркальные» уровни – RAID 1, 1+0, 10, 1E, 1E0.

Давайте еще раз попробуем досконально разобраться, чем же различаются эти уровни?
RAID 1.
Это – классическое «зеркало». Два (и только два!) жестких диска работают как один, являясь полной копией друг друга. Выход из строя любого из этих двух дисков не приводит к потере ваших данных, так как контроллер продолжает работу с оставшимся диском. RAID1 в цифрах: двукратная избыточность, двукратная надежность, двукратная стоимость. Производительность на запись эквивалентна производительности одного жесткого диска. Производительность чтения выше, так как контроллер может распределять операции чтения между двумя дисками.

RAID 10.
Суть этого уровня в том, что диски массива объединяются парами в «зеркала» (RAID 1), а затем все эти зеркальные пары в свою очередь объединяются в общий массив с чередованием (RAID 0). Именно поэтому его иногда обозначают как RAID 1+0. Важный момент – в RAID 10 можно объединить только четное количество дисков (минимум – 4, максимум – 16). Достоинства: от «зеркала» наследуется надежность, от «нуля» – производительность как на чтение, так и на запись.
RAID 1Е.
Буква «E» в названии означает «Enhanced», т.е. «улучшенный». Принцип этого улучшения следующий: данные блоками «чередуются» («striped») на все диски массива, а потом еще раз «чередуются» со сдвигом на один диск. В RAID 1E можно объединять от трех до 16 дисков. Надежность соответствует показателям «десятки», а производительность за счет большего «чередования» становится чуть лучше.
RAID 1Е0.
Этот уровень реализуется так: мы создаем «нулевой» массив из массивов RAID1E. Следовательно, общее количество дисков должно быть кратно трем: минимум три и максимум – шестьдесят! Преимущество в скорости при этом мы вряд ли получим, а сложность реализации может неблагоприятно отразиться на надежности. Главное достоинство – возможность объединить в один массив очень большое (до 60) количество дисков.
Сходство всех уровней RAID 1X заключается в их показателях избыточности: ради реализации надежности жертвуется ровно 50% суммарной емкости дисков массива.

Читайте также статью «RAID 10 или RAID 1E. Что лучше?» на нашем сайте.

Андрей Егоров, начальник отдела по работе с корпоративными клиентами ЗАО «ТИМ», сертифицированный профессионал – MCSE, Master CNE, CIA, ICIS, etc.

История

Аббревиатура «RAID» изначально расшифровывалась как «Redundant Array of Inexpensive Disks» («избыточный (резервный) массив недорогих дисков», так как они были гораздо дешевле дисков SLED (Single Large Expensive Drive)). Именно так был представлен RAID его создателями Петтерсоном (David A. Patterson), Гибсоном (Garth A. Gibson) и Катцом (Randy H. Katz) в 1987 году. Со временем «RAID» стали расшифровывать как «Redundant Array of Independent Disks» («избыточный (резервный) массив независимых дисков»), потому что для массивов приходилось использовать и дорогое оборудование (под недорогими дисками подразумевались диски для ПЭВМ).

Калифорнийский университет в Беркли представил следующие уровни спецификации RAID, которые были приняты как стандарт де-факто:

  • RAID 1 — зеркальный дисковый массив;
  • RAID 2 — зарезервирован для массивов, которые применяют код Хемминга;
  • RAID 3 и RAID 4 — дисковые массивы с чередованием и выделенным диском чётности;
  • RAID 5 — дисковый массив с чередованием и отсутствием выделенного диска чётности.

В современных RAID-контроллерах предоставлены дополнительные уровни спецификации RAID:

  • RAID 0 — дисковый массив повышенной производительности с чередованием, без отказоустойчивости. Строго говоря, RAID-массивом не является, поскольку избыточность (redundancy) в нём отсутствует;
  • RAID 6 — дисковый массив с чередованием, использующий две контрольные суммы, вычисляемые двумя независимыми способами;
  • RAID 10 — массив RAID 0, построенный из массивов RAID 1;
  • RAID 01 — массив RAID 1, построенный из массивов RAID 0 (имеет низкую отказоустойчивость);
  • RAID 1E (зеркало из трёх устройств), RAID 50 (массив RAID 0 из массивов RAID 5), RAID 05 (RAID 5 из RAID 0), RAID 60 (RAID 0 из RAID 6) и различные другие.

Аппаратный RAID-контроллер может иметь дополнительные функции и одновременно поддерживать несколько RAID-массивов различных уровней. При этом контроллер, встроенный в материнскую плату, в настройках BIOS имеет всего два состояния (включён или отключён), поэтому новый жёсткий диск, подключённый в незадействованный разъём контроллера при активированном режиме RAID, может игнорироваться системой, пока он не будет ассоциирован как ещё один RAID-массив типа JBOD (spanned), состоящий из одного диска.

Уровни RAID, реализуемые средствами файловой системы ZFS:

  • RAID-Z — один избыточный диск;
  • RAID-Z2 — два избыточных диска;
  • RAID-Z3 — три избыточных диска.

Базовые уровни RAID

RAID 0

Схема RAID 0

RAID 0 (striping — «чередование») — дисковый массив из двух или более жёстких дисков без резервирования. Информация разбивается на блоки данных ( A i {\displaystyle A_{i}} ) фиксированной длины и записывается на оба/несколько дисков поочередно, то есть один блок на первый диск, а второй блок на второй диск соответственно.

(+): Скорость считывания файлов увеличивается в n раз, где n — количество дисков. При этом такая оптимальная производительность достигается только для больших запросов, когда фрагменты файла находятся на каждом из дисков.

(-): Увеличивается вероятность потери данных: если вероятность отказа 1 диска равна p, то вероятность выхода из строя массива RAID 0 из двух дисков равна 2p-p*p. Таким образом, если вероятность отказа одного диска за год равна 1 %, то вероятность отказа массива RAID0 из двух дисков составляет 1,99 %, то есть практически в два раза больше.

RAID 1

Два диска — минимальное количество для построения «зеркального» массиваСхема RAID 1

RAID 1 (mirroring — «зеркалирование») — массив из двух (или более) дисков, являющихся полными копиями друг друга. Не следует путать с массивами RAID 1+0 (RAID 10), RAID 0+1 (RAID 01), в которых используются более сложные механизмы зеркалирования.

(+): Обеспечивает приемлемую скорость записи (такую же, как и без дублирования) и выигрыш по скорости чтения при распараллеливании запросов.

(+): Имеет высокую надёжность — работает до тех пор, пока функционирует хотя бы один диск в массиве. Вероятность выхода из строя сразу двух дисков равна произведению вероятностей отказа каждого диска, то есть значительно ниже вероятности выхода из строя отдельного диска. На практике при выходе из строя одного из дисков следует срочно принимать меры — вновь восстанавливать избыточность. Для этого с любым уровнем RAID (кроме нулевого) рекомендуют использовать диски горячего резерва.

(-): Недостаток RAID 1 в том, что по цене двух (и более) жестких дисков пользователь фактически получает объём лишь одного.

RAID 2

Массивы такого типа основаны на использовании кода Хэмминга. Диски делятся на две группы: для данных и для кодов коррекции ошибок, причём если данные хранятся на 2 n − n − 1 {\displaystyle 2^{n}-n-1} дисках, то для хранения кодов коррекции необходимо n {\displaystyle n} дисков. Суммарное количество дисков при этом будет равняться 2 n − 1 {\displaystyle 2^{n}-1} . Данные распределяются по дискам, предназначенным для хранения информации, так же, как и в RAID 0, то есть они разбиваются на небольшие блоки по числу дисков. Оставшиеся диски хранят коды коррекции ошибок, по которым в случае выхода какого-либо жёсткого диска из строя возможно восстановление информации. Метод Хэмминга давно применяется в памяти типа ECC и позволяет на лету исправлять однократные и обнаруживать двукратные ошибки.

Достоинством массива RAID 2 является повышение скорости дисковых операций по сравнению с производительностью одного диска.

Недостатком массива RAID 2 является то, что минимальное количество дисков, при котором имеет смысл его использовать — 7, только начиная с этого количества для него требуется меньше дисков, чем для RAID 1 (4 диска с данными, 3 диска с кодами коррекции ошибок), в дальнейшем избыточность уменьшается по экспоненте.

Расчётное количество дисков для организации RAID 2

Схема RAID 2

RAID 3

Схема RAID 3

В массиве RAID 3 из n {\displaystyle n} дисков данные разбиваются на куски размером меньше сектора (разбиваются на байты или блоки) и распределяются по n − 1 {\displaystyle n-1} дискам. Ещё один диск используется для хранения блоков чётности. В RAID 2 для этой цели применялся n − 1 {\displaystyle n-1} диск, но большая часть информации на контрольных дисках использовалась для коррекции ошибок «на лету», в то же время большинство пользователей устраивает простое восстановление информации в случае её повреждения, для чего хватает данных, умещающихся на одном выделенном жёстком диске.

Отличия RAID 3 от RAID 2: невозможность коррекции ошибок на лету.

Достоинства:

  • высокая скорость чтения и записи данных;
  • минимальное количество дисков для создания массива равно трём.

Недостатки:

  • массив этого типа хорош только для однозадачной работы с большими файлами, так как время доступа к отдельному сектору, разбитому по дискам, равно максимальному из интервалов доступа к секторам каждого из дисков. Для блоков малого размера время доступа намного больше времени чтения.
  • большая нагрузка на контрольный диск, и, как следствие, его надёжность сильно падает по сравнению с дисками, хранящими данные.

RAID 4

Схема RAID 4

RAID 4 похож на RAID 3, но отличается от него тем, что данные разбиваются на блоки, а не на байты. Таким образом, удалось отчасти «победить» проблему низкой скорости передачи данных небольшого объёма. Запись же производится медленно из-за того, что чётность для блока генерируется при записи и записывается на единственный диск.

Из широко распространённых систем хранения RAID-4 применяется на устройствах компании NetApp (NetApp FAS), где его недостатки успешно устранены за счет работы дисков в специальном режиме групповой записи, определяемом используемой на устройствах внутренней файловой системой WAFL.

RAID 5

Схема RAID 5

Основным недостатком уровней RAID от 2-го до 4-го является невозможность производить параллельные операции записи, так как для хранения информации о чётности используется отдельный контрольный диск. RAID 5 не имеет этого недостатка. Блоки данных и контрольные суммы циклически записываются на все диски массива, нет асимметричности конфигурации дисков. Под контрольными суммами подразумевается результат операции XOR (исключающее или). Xor обладает особенностью, которая даёт возможность заменить любой операнд результатом, и, применив алгоритм xor, получить в результате недостающий операнд. Например: a xor b = c (где a, b, c — три диска рейд-массива), в случае если a откажет, мы можем получить его, поставив на его место c и проведя xor между c и b: c xor b = a. Это применимо вне зависимости от количества операндов: a xor b xor c xor d = e. Если отказывает c, тогда e встаёт на его место и, проведя xor, в результате получаем c: a xor b xor e xor d = c. Этот метод по сути обеспечивает отказоустойчивость 5 версии. Для хранения результата xor требуется всего 1 диск, размер которого равен размеру любого другого диска в RAID.

Минимальное количество используемых дисков равно трём.

Достоинства

RAID 5 получил широкое распространение, в первую очередь благодаря своей экономичности. Объём дискового массива RAID 5 рассчитывается по формуле (n-1)*hddsize, где n — число дисков в массиве, а hddsize — размер диска (наименьшего, если диски имеют разный размер). Например, для массива из четырёх дисков по 80 гигабайт общий объём будет (4 − 1) * 80 = 240 гигабайт, то есть «потеряется» всего 25 % против 50 % RAID 10. И с увеличением количества дисков в массиве экономия (по сравнению с другими уровнями RAID, обладающими отказоустойчивостью) продолжает увеличиваться.

RAID 5 обеспечивает высокую скорость чтения — выигрыш достигается за счёт независимых потоков данных с нескольких дисков массива, которые могут обрабатываться параллельно.

Недостатки

Производительность RAID 5 заметно ниже на операциях типа Random Write (записи в произвольном порядке), при которых производительность падает на 10-25 % от производительности RAID 0 (или RAID 10), так как требует большего количества операций с дисками (каждая операция записи, за исключением так называемых full-stripe write-ов, заменяется на контроллере RAID на четыре — две операции чтения и две операции записи).

При выходе из строя одного диска надёжность тома сразу снижается до уровня RAID 0 с соответствующим количеством дисков n-1 — то есть в n-1 раз ниже надёжности одного диска — данное состояние называется критическим (degrade или critical). Для возвращения массива к нормальной работе требуется длительный процесс восстановления, связанный с ощутимой потерей производительности и повышенным риском.

В ходе восстановления (rebuild или reconstruction) контроллер осуществляет длительное интенсивное чтение, которое может спровоцировать выход из строя ещё одного или нескольких дисков массива. Кроме того, в ходе чтения могут выявляться ранее не обнаруженные сбои чтения в массивах cold data (данных, к которым не обращаются при обычной работе массива, архивные и малоактивные данные), препятствующие восстановлению. Если до полного восстановления массива произойдет выход из строя, или возникнет невосстановимая ошибка чтения хотя бы на ещё одном диске, то массив разрушается и данные на нём восстановлению обычными методами не подлежат. Для предотвращения таких ситуаций в RAID-контроллерах может применяться анализ атрибутов S.M.A.R.T.

RAID 6

Схема RAID 6

RAID 6 — похож на RAID 5, но имеет более высокую степень надёжности — три диска данных и два диска контроля чётности. Основан на кодах Рида — Соломона и обеспечивает работоспособность после одновременного выхода из строя любых двух дисков. Обычно использование RAID-6 вызывает примерно 10-15 % падение производительности дисковой группы, относительно RAID 5, что вызвано бо́льшим объёмом работы для контроллера (более сложный алгоритм расчёта контрольных сумм), а также необходимостью читать и перезаписывать больше дисковых блоков при записи каждого блока.

Комбинированные уровни

Помимо базовых уровней RAID 0 — RAID 6, описанных в стандарте «Common RAID Disk Drive Format (DEF) standard», существуют комбинированные уровни с названиями вида «RAID α+β» или «RAID αβ», что обычно означает «RAID β, составленный из нескольких RAID α» (иногда производители интерпретируют это по-своему).

Например:

  • RAID 10 (или RAID 1+0) — это RAID 0, составленный из нескольких (или хотя бы двух) RAID 1 (зеркалированных пар).
  • RAID 51 — RAID 1, зеркалирующий два RAID 5 .

Комбинированные уровни наследуют как преимущества, так и недостатки своих «родителей»: появление чередования в уровне RAID 5+0 нисколько не добавляет ему надёжности, но зато положительно отражается на производительности. Уровень RAID 1+5, наверное, очень надёжный, но не самый быстрый и, к тому же, крайне неэкономичный: полезная ёмкость тома меньше половины суммарной ёмкости дисков.

RAID 01 (RAID 0+1)

Под RAID 0+1 может подразумеваться в основном два варианта:

  • два RAID 0 объединяются в RAID 1;
  • в массив объединяются четыре и более диска, и каждый блок данных записывается на два диска данного массива; таким образом, при таком подходе, как и в «чистом» RAID 1, полезный объём массива составляет половину от суммарного объёма всех дисков (если это диски одинаковой ёмкости).

RAID 10 (RAID 1+0)

Схема архитектуры RAID 10

RAID 10 (RAID 1+0) — зеркалированный массив, данные в котором записываются последовательно на несколько дисков, как в RAID 0. Эта архитектура представляет собой массив типа RAID 0, сегментами которого вместо отдельных дисков являются массивы RAID 1. Соответственно, массив этого уровня должен содержать как минимум 4 диска (и всегда чётное количество). RAID 10 объединяет в себе высокую отказоустойчивость и производительность.

RAID 10 является достаточно надёжным вариантом для хранения данных в связи с тем, что весь массив RAID 10 будет выведен из строя только после выхода из строя всех накопителей в одном и том же массиве RAID 1. В общем массиве из 4 дисков при одном вышедшем из строя накопителе, шанс выхода из строя второго в одном и том же массиве равен 1/3*100=33 %.

Для сравнения: RAID 0+1 выйдет из строя при двух накопителях, вышедших из строя в разных массивах. Шанс выхода из строя накопителя в соседнем массиве равен 2/3*100=66 %. Однако, так как массив RAID 0 с вышедшим из строя накопителем уже не используется, то оставшийся исправным накопитель в этом массиве можно исключить из расчёта, и получим шанс того, что следующий накопитель выведет из строя массив — 2/2*100=100 %.

Нестандартные уровни RAID

RAID 1E

Схема дискового массива RAID 1E в двух вариантах для 3, 4 и 5 устройств

RAID 1E (enhanced — усовершенствованный) — зеркало, способное работать на нечётном количестве устройств.

Существуют как минимум два разных алгоритма RAID 1E:

  • RAID 1E near (он же RAID 1E striped);
  • RAID 1E interleaved.

В руководстве к вашему RAID-контроллеру может не указываться, какой именно тип RAID 1E (near или interleaved) он поддерживает. Общим для них является то, что они хорошо подходят для создания массива из трёх дисковых устройств.

В RAID 1E near первый блок данных записывается на диск № 1 и на диск № 2 (полная копия, как при RAID 1). Следующий блок — на диск № 3 и диск № 4 (если диски закончились, например, диска № 4 в массиве нет, 3-й диск последний — контроллер возвращается к диску № 1 и переходит к следующей полоске).

В RAID 1E interleaved данные чередуются по полоскам: в первую полоску пишутся сами данные, во вторую — их копия. При переходе от одной полоски к другой увеличивается индекс устройства, с которого начинается запись. Таким образом, первый блок данных записывается на диск № 1 в первой полоске и на диск № 2 во второй полоске, второй блок данных — на диск № 2 в первой полоске и на диск № 3 во второй полоске и так далее.

Результирующая ёмкость массива с использованием RAID 1E составляет S ∗ N / 2 {\displaystyle S*N/2} , где N — количество дисков в массиве, а S — ёмкость наименьшего из них.

Преимущества:

1. Хорошая скорость передачи данных и обработки запросов. 2. В отличие от RAID 1 и RAID 10, реализована возможность организации зеркала на нечётном количестве устройств.

Недостатки:

1. Увеличение стоимости, поскольку доступна лишь половина суммарной ёмкости устройств. 2. В некоторых моделях контроллеров допускается отказ только одного диска, в связи с чем при чётном количестве дисков и отсутствии диска горячей замены предпочтительнее использовать RAID 10.

Минимальное количество дисков: 3 (при двух — неотличим от RAID 1).

RAID 7

RAID 7 — зарегистрированная торговая марка компании Storage Computer Corporation, отдельным уровнем RAID не является. Структура массива такова: на n − 1 {\displaystyle n-1} дисках хранятся данные, один диск используется для складирования блоков чётности. Запись на диски кэшируется с использованием оперативной памяти, сам массив требует обязательного ИБП; в случае перебоев с питанием происходит повреждение данных.

Число 7 в названии создаёт впечатление, что система чем-то превосходят «своих младших братьев» RAID 5 и 6, но математика RAID 7 не отличается от RAID 4, а кэш и батареи используются в RAID-контроллерах любых уровней (чем дороже контроллер, тем больше вероятность наличия этих компонент). Поэтому, хотя никто не отрицает, что RAID 7 обладает высокой надёжностью и скоростью работы, — это не промышленный стандарт, а скорее маркетинговый ход единственной компании-производителя таких устройств, и только эта компания осуществляет для них техническую поддержку.

RAID-DP

Существует модификация RAID-6 компании NetApp — RAID-DP. Отличие от традиционного массива заключается в выделении под контрольные суммы двух отдельных дисков. Благодаря взаимодействию RAID-DP и файловой системы WAFL (все операции записи последовательны и производятся на свободное место) пропадает падение производительности как в сравнении с RAID-5, так и в сравнении с RAID-6.

Аппаратные RAID-контроллеры

Представляют собой плату расширения, либо размещаются вне сервера (например, в составе внешней дисковой подсистемы либо NAS). Имеют собственный процессор, многие имеют кэш-память для ускорения работы. В устройства подороже опционально устанавливаются батареи (Battery Backup Unit, сокр. BBU, химические, либо конденсаторные) для сохранения данных в кэше в случае аварийного отключения электропитания. Конденсаторные батареи более современные, но более дорогие, поскольку дополнительно требуют наличия модуля энергонезависимой FLASH-памяти, куда при аварии будет копироваться кэш. Такие батареи не портятся со временем и, в отличие от химических, не требуют замены в течение срока службы сервера.

Для подключения дисков контроллер может иметь внутренние, либо внешние порты, либо и те, и другие. Порты могут быть выполнены по различным стандартам (см. для примера список внутренних и внешних разъёмов SAS, а также SFF-8639).

Контроллеры различных производителей, как правило, не совместимы и не взаимозаменяемы между собой — это следует иметь в виду в случае выхода из строя платы контроллера. Информация о конфигурации RAID-массива хранится на дисках, но прочитать её, даже с полностью исправных дисков, и воссоздать массив сможет только контроллер того же производителя. Для предотвращения подобных проблем существуют кластерные дисковые системы. Программные RAID-массивы также лишены этого недостатка.

Сравнение уровней RAID

УровеньКоличество
дисков
Эффективная
ёмкость*
Допустимое количество
вышедших из строя дисков
НадёжностьСкорость
чтения
Скорость
записи
Примечание
0от 2S * Nнеточень низкаявысокаявысокаяполная потеря данных при выходе
из строя любого из дисков!
1от 2S * N / 2N-1 дисквысокаявысокаясредняяN-я стоимость дискового пространства
1Eот 3S * N / 2от 1 до N/2-1 дисков*****высокаявысокаянизкая
10от 4, чётноеS * N / 2от 1 до N/2 дисков**средняявысокаявысокаядвойная стоимость дискового пространства
01от 4, чётноеS * N / 2от 1 до N/2 дисков** средняявысокаявысокаядвойная стоимость дискового пространства
5от 3S * (N − 1)1 дисксредняявысокаясредняя
50от 6, чётноеS * (N − 2)от 1 до 2 дисков***средняявысокаявысокая
51от 6, чётноеS * (N − 2) / 2от 2 до N/2+1 дисков****высокаявысокаянизкаядвойная стоимость дискового пространства
5Eот 4S * (N − 2)1 дисксредняявысокаявысокаярезервный накопитель работает
на холостом ходу и не проверяется
5EEот 4S * (N − 2)1 дисксредняявысокаявысокаярезервный накопитель работает
на холостом ходу и не проверяется
6от 4S * (N − 2)2 дискавысокаявысокаянизкая или средняя**скорость записи в зависимости от реализации

(может соответствовать скорости записи RAID 5)

60от 8, чётноеS * (N − 4)от 2 до 4 дисков***средняявысокаясредняя
61от 8, чётноеS * (N − 2) / 2от 4 до N/2+2 дисков****высокаявысокаянизкаядвойная стоимость дискового пространства

* N — количество дисков в массиве, S — объём наименьшего диска.
** Информация не потеряется, если выйдут из строя диски в пределах разных зеркал.
*** Информация не потеряется, если выйдет из строя одинаковое кол-во дисков в разных stripe’ах.
**** Информация не потеряется, если выйдут из строя диски в пределах одного зеркала.
***** Информация потеряется, если одновременно выйдут из строя любые два соседних диска (либо первый с последним), иначе — не потеряется.

Программный RAID

Для реализации RAID можно применять не только аппаратные средства, но и полностью программные компоненты (драйверы). Например, в системах на ядре Linux поддержка существует непосредственно на уровне ядра. Управлять RAID-устройствами в Linux можно с помощью утилиты mdadm. Программный RAID имеет свои достоинства и недостатки. С одной стороны, он ничего не стоит (в отличие от аппаратных RAID-контроллеров, цена которых от $150). С другой стороны, программный RAID использует некоторое количество ресурсов центрального процессора.

Ядро Linux 2.6.28 (последнее из вышедших в 2008 году) поддерживает программные RAID следующих уровней: 0, 1, 4, 5, 6, 10. Реализация позволяет создавать RAID на отдельных разделах дисков, что аналогично описанному ниже Matrix RAID. Поддерживается загрузка с RAID.

ОС семейства Windows NT, такие как Windows NT 3.1/3.5/3.51/NT4/2000/XP/2003 изначально, с момента проектирования данного семейства, поддерживают программный RAID 0, RAID 1 и RAID 5 (см. Dynamic Disk). Более точно, Windows XP Pro поддерживает RAID 0. Поддержка RAID 1 и RAID 5 заблокирована разработчиками, но, тем не менее, может быть включена, путём редактирования системных бинарных файлов ОС, что запрещено лицензионным соглашением. Windows 7 поддерживает программный RAID 0 и RAID 1, Windows Server 2003 — 0, 1 и 5. Windows XP Home не поддерживает RAID.

В ОС FreeBSD есть несколько реализаций программного RAID. Так, atacontrol, может как полностью строить программный RAID, так и может поддерживать полуаппаратный RAID на таких чипах, как ICH5R. Во FreeBSD, начиная с версии 5.0, дисковая подсистема управляется встроенным в ядро механизмом GEOM. GEOM предоставляет модульную дисковую структуру, благодаря которой родились такие модули как gstripe (RAID 0), gmirror (RAID 1), graid3 (RAID 3), gconcat (объединение нескольких дисков в единый дисковый раздел). Также существуют устаревшие классы ccd (RAID 0, RAID 1) и gvinum (менеджер логических томов vinum). Начиная с FreeBSD 7.2 поддерживается файловая система ZFS, в которой можно собирать следующие уровни RAID: 0, 1, 5, 6, а также комбинируемые уровни.

OpenSolaris и Solaris 10 используют Solaris Volume Manager, который поддерживает RAID 0, RAID 1, RAID 5 и любые их комбинации, как 1+0. Поддержка RAID 6 осуществляется в файловой системе ZFS.

Дальнейшее развитие идеи RAID

Синий разъём PCI-X на материнской плате сервера FSC Primergy TX200 S2 специально предназначен для платы ноль-канального RAID (zero-channel RAID, ZCR). Установлен MegaRAID 320-0 Zero Channel RAID Controler фирмы LSI)

Идея RAID-массивов — в объединении дисков, каждый из которых рассматривается как набор секторов, и в результате драйвер файловой системы «видит» как бы единый диск и работает с ним, не обращая внимания на его внутреннюю структуру. Однако, можно добиться существенного повышения производительности и надёжности дисковой системы, если драйвер файловой системы будет «знать» о том, что работает не с одним диском, а с набором дисков.

Более того, при разрушении любого из дисков в составе RAID 0 вся информация в массиве окажется потерянной. Но если драйвер файловой системы разместил каждый файл на одном диске, и при этом правильно организована структура каталогов, то при разрушении любого из дисков будут потеряны только файлы, находившиеся на этом диске; а файлы, целиком находящиеся на сохранившихся дисках, останутся доступными. Схожая идея «повышения надёжности» реализована в массивах JBOD.

Размещение файлов по принципу «каждый файл целиком находится на одном диске» сложным/неоднозначным образом влияет на производительность дисковой системы. Для мелких файлов латентность (время позиционирования головки над нужным треком + время ожидания прихода нужного сектора под головку) важнее, чем время собственно чтения/записи; поэтому если мелкий файл целиком находится на одном диске, доступ к нему будет быстрее, чем если он разнесён на два диска (структура RAID-массивов такова, что мелкий файл не может оказаться на трёх и более дисках). Для крупных файлов размещение строго на одном диске может оказаться хуже, чем размещение на нескольких дисках; однако, это проявится только если обмен данными производится большими блоками; либо если к файлу делается много мелких обращений в асинхронном режиме, что позволяет работать сразу со всеми дисками, на которых размещён этот файл.

> Интересные факты

Годовая вероятность отказа дискового массива RAID 5 из 3 дисков WD Caviar Blue = 0,05 %.

Ссылки

RAID на Викискладе

  • Новые уровни RAID: цифры, буквы и то, что за ними
  • Неизбыточно о RAID (XOR, RAID-Z)
  • All RAID Levels Description by iXBT.com
  • Быстрое восстановление Raid массива при сбое одного из дисков
  • Восстановление RAID массивов простыми методами
  • Пример восстановления данных (виртуально) с неисправного NAS Raid массива 1Tb
  • Пример восстановления данных с Raid 0 при помощи WinHex
Для улучшения этой статьи желательно:

  • Викифицировать статью.
  • Найти и оформить в виде сносок ссылки на независимые авторитетные источники, подтверждающие написанное.

Одной из важнейших составляющих персонального компьютера являются жесткие диски, отвечающие за хранение информации. Именно с них запускается операционная система, на них же располагается файл подкачки.

Многие из читателей наверняка сталкивались с ситуацией, когда спустя время винчестер начинал работать не так качественно и шустро, как это было вначале, а значит перед ними вставал вопрос – как повысить характеристики подобных устройств? Сегодня мы рассмотрим разнообразные виды raid массивов, которые призваны помочь справится с подобной задачей, но сперва разберемся с тем, что это вообще такое.

Дисковые массивы Raid и их назначение

RAID – комплекс из нескольких жестких дисков, который призван повысить надежность хранения данных и скорость чтения/записи информации на них. Существуют разные типы конфигурации подобных массивов, которые имеют свои порядковые номера, например, raid 2 или raid 5. Подобные комплексы значительно эффективнее использования привычного жесткого диска, потому решив использовать массив raid 0 или иной, вы незамедлительно получите колоссальный прирост в производительности системы.

Проблема эффективности жестких дисков связана с тем, что пока другие комплектующие прирастают ядрами, частотой, кэшем как процессоры, или числом пиксельных конвейеров, разрядностью и количеством памяти как видеокарты, сами винчестеры растут только в объеме внутренней памяти, а скорость оборота головки, кэш и архитектура уже давно не подвергаются значительным усовершенствованиям.

RAID-массив представляет собой два или более жестких диска, подключенных к материнской плате, которая в свою очередь должна поддерживать возможность создания RAID. Визуально это ничем не отличается от привычного использования нескольких жестких дисков, никаких дополнительных соединений и проводов не предусмотрено, но отличается программный подход, который как раз и зависит от выбранного типа RAID-массива.

Скажем пару слов о том, как создать raid массив. Установка подобного девайса проста и может быть проведена даже неопытным пользователем – просто берется два или более идентичных жестких диска и подключаются к материнской карте, после чего необходимо зайти в BIOS и установить параметр SATA Configuration: RAID.

Прежде чем начать экспериментировать с различными уровнями raid стоит знать, что при создании или удалении raid вся информация с жестких дисков пропадает, потому важную информацию предварительно стоит скопировать, а с желаемой конфигурацией определиться заблаговременно.

Читайте на сайтеСпособы проверки и восстановления жесткого диска

Виды RAID-массивов

Raid 0, он же страйп, предполагает использование от двух до четырех жестких дисков, которые занимаются обработкой информации совместно, что в конечном счете приводит к значительному увеличению производительности. Программа в такой ситуации разбивается на несколько блоков данных и записывается поочередно на все винчестеры – один блок данных на первый диск, второй на другой и так далее.

К сожалению, помимо преимуществ у данного типа конфигурации есть и минусы – если один из жестких дисков выйдет из строя, то информация пропадет целиком и без возможности ее восстановить на этом raid-массиве. Так происходит вследствие того, что информация с одного файла может располагаться на разных дисках, а значит добраться до нее будет невозможно. Потому настоятельно рекомендуем всю ценную информацию постоянно копировать на внешний носитель во избежание непредвиденных ситуаций.

Raid 1, он же зеркало, отличается высокой надежностью, так как данные в данном случае дублируются на каждый жесткий диск, таким образом, пока цел хотя бы один из них, вы всегда сможете получить доступ к интересующей вас информации. Обычно подобная конфигурация используется в серверах дабы обеспечить максимальную жизнеспособность и долговечность для ценных данных.

Минус понятен – второй жестки диск в данном случае используется в качестве бэкапа, соответственно вы теряете его пространство и купив два винчестера объемом по одному терабайту, доступен вам будет всего один из них. Так же стоит сказать пару слов о производительности – она не выше, а по ощущениям даже ниже чем при использовании одного жесткого диска, потому рекомендуем собирать такой raid-массив из ssd, дабы не получить на выходе слишком уж медленную систему.

Остальные массивы пользуются значительно меньшей популярностью, но также имеют ряд преимуществ о которых стоит упомянуть. Их настройки в Windows 10 или Windows 7 идентична описанной выше, а потому проблем с использованием данных конфигураций возникнуть не должно.

Raid 2 похож на raid 0 – данные, разбитые на небольшие блоки, распределяются по дискам, но существую и свободные от этой задачи винчестеры, которые хранят коды коррекции ошибок, с помощью которых вы сможете извлечь информацию с вышедшего из строя жесткого диска. Да, данный способ безопаснее для хранящейся информации чем raid 0, но и физических носителей ему требуется вдвое больше, а прирост надежности не так уж и очевиден. Каждый сам для себя решает имеет ли смысл переплатить вдвое за подобную функцию.

Остальные конфигурации массивов связаны с созданием специального диска четности, но большинству пользователей, имеющих целью просто повысить работоспособность ПК или обезопасить свои данные, данные виды пригодятся очень вряд ли. Некоторые из них быстрее, некоторые безопаснее, но помните, что ради любых преимуществ все же придется чем-то жертвовать, а в данном случае потребуется еще и довольно большое число необходимых жестких дисков.

Raid 3 и Raid 4 практически идентичны, в обоих используется отдельный жесткий диск, отвечающий за хранение контрольных сумм, таким образом вам понадобится минимум три винчестера. Информация в такой системе может быть восстановлена, но не так быстро, как в случае R2 – сначала все же придется заменить вышедший из строя элемент массива. Различия же заключается в том, что Raid 3 разбивает информацию на байты, а Raid 4 – на блоки, а потому последний работает прилично быстрее. К сожалению, обе конфигурации оказывают повышенное воздействие на диск с контрольными суммами, а потому его долговечность значительно сокращается.

Raid 5 – это отказоустойчивый массив с распределенным хранением контрольных сумм, то есть информация будет записываться на все диски кроме последнего, на котором организовано хранение контрольных сумм. Если один из дисков выйдет из строя, то массив автоматически перейдет в аварийный режим, в котором потребуется заметно больше времени на обработку любой информации. А в случае выхода двух и более винчестеров информацию будет уже не восстановить, хотя подобная ситуация и маловероятна.

Кстати, существуют так же и комбинированные массивы, целью которых является сохранение преимуществ каждого из традиционных RAID, но и сокращение присущих им негативных эффектов. Таким образом, при использовании Raid 10 или Raid 0+1 вы добьетесь более высокого быстродействия и надежности одновременно, но в домашних условиях подобная затея будет не слишком целесообразной, ведь ради предотвращения маловероятного события будут расходоваться избыточные ресурсы.

Какой массив выбрать, если я…?

Если ваш персональный компьютер используется как игровая и мультимедийная платформа, что неизбежно сопряжено с постоянной установкой программ и копированием файлов, то Raid 0 несомненно значительно облегчит вашу жизнь, ускорив работу системы. Помните, что при выходе хотя бы одного из винчестеров, вся информация будет утеряна, а значит внимательно отнеситесь к выбору модели жестких дисков, которые вы собираетесь использовать, дабы обеспечить максимальную долговечность сборки.

Если же вы предпочитаете использовать ПК как рабочий инструмент и храните на нем информацию, потеря которой может обернуться катастрофой, то обязательно обдумайте использование в качестве массива конфигурацию raid 1. Назначение данного массива как нельзя лучше подойдет для офисных сборок, вокруг которых айтишники постоянно ломают голову – как сделать информацию защищенной от проблем физического старения техники?

В общем и целом, советуем каждому владельцу персонального компьютера внимательно изучить технологию raid-массивов и скорейшим образом начать ее использование, ведь за небольшую дополнительную сумму вы сможете заполучить гораздо более шустрое или надежное устройство, чего добиться другим методом просто невозможно.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *