RAID-массивы

RAID-массивы (Redundant Array of Inexpensive/Independent Disks — «расширенный массив недорогих/независимых дисков»):
  1. Технология RAID впервые разработана в 1987 сотрудниками Калифорнийского университета в Беркли. Ее основная цель: обеспечение надежности хранения данных в дисковой памяти и повышение производительности персональных компьютеров. Основные признаки технологии: предполагается использование наборов дисков, доступных пользователям как один логический диск; данные распределяются по набору дисков определенным способом, соответствующим одному из уровней RAID; в целях ускорения процессов чтения/записи фрагменты данных могут распределяться по разным дискам (расщепление); на случай неисправностей («отказов») дисков массив содержит дополнительную («избыточную») емкость, обеспечивающую возможность восстановления данных (в соответствии с этим способом с каждого накопителя производится выборка данных, над которыми выполняются логические операции, причем результирующие данные сохраняются на одном или нескольких дополнительных накопителях). В результате как бы составляется уравнение с четырьмя переменными, причем каждая переменная и решение хранятся на отдельных накопителях. При отказе дисковода с данными система производит перерасчет уравнения и выявляет недостающие биты (однако если откажут одновременно сразу два накопителя, то для восстановления утерянных данных информации будет недостаточно). В RAID уровня 5 контрольная информация записывается на все диски массива, а в RAID уровней 2, 3 и 4 — на специально выделенный для этой цели накопитель.
  2. Набор спецификаций устройств хранения данных связан с уровнями RAID, определяющими способы распределения данных на дисковом массиве, их резервирования и восстановления.
  3. Архитектура RAID, которая определяет различные способы объединения нескольких жестких дисков в единую систему так, чтобы она функционировала как один диск. Совместная работа дисков в массивах RAID организуется с применением параллельного или независимого доступа. В соответствии с разными типами доступа к записи и считыванию данных существуют различные типы RAID-массивов. Кроме того, уровни RAID различаются способами формирования и размещения избыточных данных. Последние могут находиться либо на специально выделенном диске, либо распределяться между всеми дисками. Простейшим из этих способов является полное дублирование (избыточность = 100%) или зеркалирование. Примером является конструкция накопителей с зеркальными дисками. Изначально было определено шесть уровней RAID, позднее появились дополнительные смешанные уровни (всего определено 8 уровней), а также их комбинации.
В зависимости от того, как осуществляется управление, массивы RAID делятся на две категории — с программным контролем и аппаратным. Последние в свою очередь различаются расположением управляющего аппаратного обеспечения: внешний, либо встроенный хост-контроллер (такую конфигурацию иногда называют SCSI-to-SCSI).

Типы RAID-массивов
RAID 0 — дисковый массив без дополнительной отказоустойчивости: поток данных разбивается на блоки, которые последовательно записываются на диски. Основные достоинства: простота конструкции и изготовления, высокая производительность. Недостатком является низкая отказоустойчивость (выход из строя одного из дисков приводит к потере всех данных, хранящихся в дисковом массиве).
RAID 1 — дисковый массив с зеркалированием данных: блок данных записывается в двух экземплярах на отдельные диски. Достоинства: скорость записи та же, что и для одного диска, высокая скорость восстановления данных, простота конструкции, единственный вид RAID-массивов, позволяющий получить отказоустойчивую дисковую подсистему на двух дисках. Недостаток: низкий коэффициент использования дискового пространства (отношение объема полезных данных к суммарному объему дискового массива), равный 0, 5.
RAID 2 — дисковый массив, использующий Алгоритм Хамминга для проверки/восстановления данных: поток данных разбивается на «слова данных», каждое слово данных в свою очередь разбивается на биты, при этом количество бит в слове должно равняться количеству дисков с данными, биты последовательно записываются на диски с данными. Для каждого слова данных по Алгоритму Хамминга вычисляется слово ECC — кода (Error Checking/Correction Code) — «Кода для проверки/коррекции ошибок», по существу являющегося контрольной суммой, запись которой используется для проверки и исправления ошибок. Достоинства: высокая скорость исправления ошибок и передачи данных (последняя тем выше, чем больше количество дисков в массиве), коэффициент использования дискового пространства увеличивается с ростом числа дисков в массиве, относительная по сравнению с RAID 3, 4 и 5 (см. далее) простота контроллера. Недостатки: в случае малого размера «слова данных» — очень низкий коэффициент использования дискового пространства.
RAID 3 — дисковый массив с вычислением контрольной суммы параллельно с передачей данных: поток данных разбивается на сегменты, которые записываются на диски, контрольная сумма вычисляется при выполнении операции записи и сохраняется на диске с данными контроля. Достоинства: очень высокая скорость чтения и записи данных, выход из строя одного диска незначительно влияет на общую производительность массива, высокий коэффициент использования дискового пространства. Недостатки: трудность реализации программными средствами, средняя сложность конструкции, программная реализация требует значительной вычислительной мощности.
RAID 4 — дисковый массив с независимыми дисками данных и общим диском для хранения контрольных сумм: массив данных делится на блоки, каждый блок данных целиком записывается на диск, запись производится последовательно по дискам, контрольная сумма (общая для всех блоков одного ряда) вычисляется во время операции записи данных, помещается на диск с контрольными данными и проверяется в процессе чтения. Достоинства: высокая скорость чтения данных и высокий коэффициент использования дискового пространства. Недостатки: наименьшая из всех RAID-массивов скорость записи, сложный и неэффективный алгоритм восстановления данных в случае выхода из строя одного из дисков.
RAID 5 — дисковый массив с независимыми дисками данных и равномерным распределением контрольных сумм между дисками: блоки данных последовательно записываются на диски, контрольная сумма для блоков одного ряда вычисляется во время записи, контрольные суммы размещаются последовательно по всем дискам. Достоинства: высокая скорость чтения и записи данных, высокий коэффициент использования дискового пространства. Недостатки: выход из строя одного из дисков оказывает заметное влияние на производительность, сложный конструктив контроллера, сложный алгоритм восстановления данных в случае выхода из строя одного из дисков. До настоящего времени RAID 5 наиболее часто использовался для построения дисковых массивов серверов, поскольку он характеризуется небольшой избыточностью и эффективной системой восстановления данных. Однако для развитых корпоративных систем с большим количеством дисковых устройств высокой емкости, объединенных в общие системы хранения данных нескольких серверов, этот режим стал опасен: при аварии одного из серверов может выйти из строя вся система.
RAID 6 — дисковый массив с независимыми дисками данных и двумя независимыми схемами контрольных сумм, распределенными между дисками: усовершенствованный вариант RAID 5, к которому добавлена еще одна схема контрольных сумм, независимая от первой. Достоинства: высокая скорость чтения данных и высокая отказоустойчивость. Недостатки: сложная конструкция контроллера, большая нагрузка на контроллер при вычислении контрольных сумм, очень малая скорость записи, низкий коэффициент использования дискового пространства (например, для массива из 5 дисков он равен ~0, 6-0, 8). По указанным причинам до недавнего времени ни одна из коммерческих фирм не производила дисковых подсистем этого типа. Однако расширенные возможности защиты данных, а также рост объема дисковых массивов и емкости самих дисков в условиях развития корпоративных систем с общей дисковой памяти делают эту технологию привлекательной. В частности, в своих процессорах ввода/вывода Intel IOP 333 корпорация Intel предлагает реализацию алгоритмов RAID 6.
RAID 7 — дисковый массив с асинхронным вводом/выводом и высокой скоростью передачи данных: все операции ввода/вывода выполняются в асинхронном режиме т.е. все операции контролируются независимо от выполнения других, данные в процессе ввода/вывода кэшируются, управление массивом RAID 7 возложено на многозадачную операционную систему, благодаря которой каналы передачи данных контролируются в режиме реального времени. Массив RAID 7 может иметь до 12 внешних интерфейсов обмена данными, что позволяет подключать массив одновременно к нескольким компьютерам; поддерживается технология «горячей замены» вышедших из строя дисков, а также возможен мониторинг состояния и управление массивом в удаленном режиме. Преимущества: производительность выше в 1, 25-6 раз, по отношению к RAID-массивам других типов; очень высокая скорость доступа к данным в многопользовательской среде; скорость чтения и записи увеличивается при увеличении числа дисков в массиве. Недостатки: высокая стоимость, массивы этого типа производит только одна фирма (Storage Computer).
RAID 0/1 — комбинация уровней RAID 0 и 1, однако данные хранятся по меньшей мере на четырех дисках.
RAID 10 — комбинация технологий RAID 1 и RAID 0. Достоинства: Имеет ту же отказоустойчивость, что и RAID 1, скорость записи и чтения несколько выше, чем у RAID 1.
RAID 30 — комбинация уровней RAID 3 и 0 для повышения производительности ПК.
RAID 50 — комбинация уровней RAID 5 и 0 для повышения производительности ПК.
RAID 53 — комбинация уровней RAID 3 и 0, при которой, если диски расположить схематически в виде прямоугольной матрицы, то столбцы будут составлять массивы RAID 3 (у некоторых производителей — RAID 5), а ряды — массивы RAID 0. Такой массив достаточно дорог в реализации, к тому же все шпиндели дисков должны быть синхронизованы, что ограничивает выбор дисков. Достоинства: имеет такую же отказоустойчивость, что и RAID 3, при несколько более высокой скорости чтения и записи. Недостатки: высокая стоимость, низкий коэффициент использования дискового пространства.
Intel Matrix Raid — технология построения на двух жестких дисках двух RAID-массивов, образующих два логических диска, которые обеспечивают высокую производительность, соответствующую RAID 0, и высокую надежность хранения данных, соответствующую RAID 1. Оба массива занимают на дисках выделенное для них пространство и работают независимо один от другого. Соотношения объемов массивов определяются пользователем. Данные, размещенные в разделе RAID 1, сохраняются при отказе одного из жестких дисков.
Статья находится в рубриках
Яндекс.Метрика