RAID системы
Основное предназначение дисковых систем RAID, причины создания. Преимущества RAID: позволяет увеличить производительность, позволяет увеличить объем. Анализ структуры подсистемы RAID, принципы работы. Характеристика консультативного комитета RAID.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 04.09.2012 |
Размер файла | 3,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Реферат
"RAID системы"
система raid консультативный комитет
Дисковые системы RAID
Системы хранения данных, которые позволяют защитить данные и увеличить производительность, предлагаются большим количеством поставщиков. В эти системы входят микропроцессор, блок питания, системы охлаждения, управления хранилищами данных и сетью.
Дисковые подсистемы, включающие микропроцессоры для представления внутренних жестких дисков как более объемных виртуальных дисков, называют системами RAID. Подсистемы, не обладающие такой возможностью, называют JBOD (Just a Bunch Of Disks - простой массив дисков). Системы JBOD подключают к внешним разъемам SCSI контроллера RAID установленного в компьютере. Разница между системами RAID и JBOD показана на рисунке.
Рис.
Три аргумента в пользу RAID
Системы RAID (Redundant Array of Inexpensive Disks - массив недорогих дисков с избыточностью) были созданы в рамках исследовательского проекта в 1980-х в Калифорнийском Университете в Беркли. Сегодня большинство устройств для хранения данных стоят недорого, поэтому вместо слова inexpensive - "недорогие", используется independent - "независимые". В любом случае, слова, составляющие акроним, не слишком хорошо объясняют преимущества RAID. Есть три основные причины, объясняющие популярность RAID среди специалистов по информационным технологиям:
· RAID позволяет увеличить объем и улучшить управление хранилищами данных;
· RAID позволяет увеличить производительность;
· RAID позволяет увеличить надежность и доступность при хранении данных.
Системам RAID было посвящено большое количество научно- исследовательских проектов в области хранения данных, в результате на рынке появилось несколько успешно реализованных концепций. Мы объясним, почему RAID интересует так много людей и как он работает в традиционных условиях, а также как он может быть использован в сетях хранения данных.
Производительность и управляемость RAID
Одной из фундаментальных идей, используемых в RAID, является виртуализация устройств. Другими словами, система RAID, состоящая из нескольких отдельных физических дисков, может восприниматься хост- компьютером как один большой, быстрый, надежный жесткий диск. Результат напоминает глаз мухи, в котором отдельные маленькие части составляют единое большее целое. Идею иллюстрирует рисунок 1.
Наращиваем мощность
Подсистемы RAID значительно облегчают построение крупномасштабных систем обработки информации, поддерживающих большие массивы данных.
Например, подсистема RAID из десяти отдельных жестких дисков может восприниматься шиной хранилища или сетью как единый адрес или LUN (logical unit number - номер логического устройства). Общая емкость всех дисков подсистемы RAID действительно очень важна, хотя реально используемый объем такой системы меньше суммы емкостей составляющих ее дисков участников (member disks). (Member disk (в дословном переводе - "диск-участник") - это один из дисков, составляющих систему RAID).
Емкость подсистемы RAID снижается за счет служебных данных, передаваемых используемым алгоритмом RAID. Полезную емкость RAID можно рассчитать, зная используемый алгоритм RAID и количество дисков в массиве. Последнее определяет количество служебных данных, необходимых для запуска функции RAID. Полезная емкость массива RAID составляет от 50 до 90 процентов суммарного объема составляющих его дисков.
Рис.
Достижение производительности через расслоение операций ввода-вывода
Одним из принципов работы RAID, является "расслоение". Расслоение заключается в распределении (дроблении) операции ввода-вывода по дискам, чтобы контроллер ввода-вывода хоста мог обрабатывать больше операций, по сравнению с тем, как если бы он работал с одним-единственным диском. Существует два основных типа расслоенных массивов, которые используются в RAID:
· Расслоенные массивы с параллельным доступом
· Расслоенные массивы с независимым доступом
Массивы обоих типов позволяют увеличить производительность, однако они созданы для разных типов данных и приложений. Давайте познакомимся с обоими и сравним.
Расслоенные массивы с параллельным доступом
Принцип работы расслоенных массивов с параллельным доступом заключается в синхронизации вращения носителей дисков-участников, приеме одного запроса ввода-вывода и выполнении его на всех дисках одновременно. Таким образом, каждый запрос ввода-вывода мгновенно распределяется по всем дискам массива. Чтобы параллельное расслоение работало, каждый диск должен работать синхронно с остальными дисками массива. Исполнительные механизмы дисков должны двигаться с одинаковой скоростью, должна быть одинаковой скорость вращения пластин, и электроника дисков должна быть способна обрабатывать команды и перемещать данные в буфер и из него с той же скоростью, что и электронные системы остальных дисков массива. Рисунок 2 иллюстрирует, как данные расслаиваются при записи на диски-участники. Диаграмма показывает четыре диска массива, от диска 1 до диска 4. Они показаны в пять разных моментов времени, от t=0 до t=4. Диски вращаются с одинаковой частотой.
1. В момент времени t=0, первый слой передаваемых данных записывается в буфер диска 1. Буферы остальных дисков находятся в состоянии готовности.
2. В момент времени t=1, второй слой передаваемых данных записывается в буфер диска 2. Буфер диска 1 начинает переписывать данные на диск. Буферы остальных дисков находятся в состоянии готовности.
3. В момент времени t=2, третий слой передаваемых данных записывается в буфер диска 3. Буфер диска 1 заканчивает переписывать данные на диск. Буфер диска 2 начинает переписывать данные на диск. Буфер диска 4 находится в состоянии готовности.
4. В момент времени t=3, четвертый слой передаваемых данных записывается в буфер диска 4. Буфер диска 1 переходит в состояние готовности. Буфер диска 2 завершает переписывание данные на диск. Буфер диска 3 начинает переписывать данные на диск.
5. В момент времени t=4, буфер диска 1 опять заполняется. Буфер диска 2 находится в состоянии готовности. Буфер диска 3 заканчивает переписывание данные на диск. Буфер диска 3 начинает переписывать данные на диск.
Приложения для расслоенных массивов с параллельным доступом
Расслоенные массивы с параллельным доступом хороши для приложений, характеризующиеся длительным, последовательным обращением к данным. Это некоторые из приложений, которые выигрывают от алгоритма кэширования на опережении считывания:
· Приложения, обслуживающие большие файлы последовательного доступа
o Мультимедиа: видео и аудио
o Обработка фильмов и графики, анимация
o Автоматизированное проектирование (CAD, computer aided design)
· Долговременное хранение данных
Массивы параллельного доступа не эффективны в условиях с высокой скоростью транзакций, потому что в них предусмотрена обработка единственного запроса (транзакции) ввода-вывода в один момент времени. Каждый отдельный запрос (транзакция) обрабатывается с более высокой скоростью, но одновременная их обработка невозможна. Массивы параллельного доступа несколько сокращают латентность на вращение пластин, синхронизируя его. Однако, латентность на вращение все же снижает производительность: когда операция начинается, приходится ждать, пока первый диск массива закончит позиционирование. Кроме того, массивы параллельного доступа не делают ничего для устранения задержки по времени поиска. Фактически, время поиска в массивах с параллельным доступом может быть даже больше, чем в случае с одним диском, так как перед началом операции все диски должны позиционировать свои головки чтения/записи.
Расслоенные массивы с независимым доступом
Другим типом расслоенных массивов являются диски с независимым доступом. Другими словами, диски не синхронизированы, и данные обычно записываются сегментами большего объема на отдельные диски, в отличие от предыдущего случая, когда все данные записывались сразу на все диски массива. Характеристикой производительности дисков с независимым доступом является число одновременно обрабатываемых операций ввода-вывода, которое массив способен поддерживать. Например, в массиве может быть 12 дисков, а контроллер ввода-вывода хоста всего один.
Операции ввода-вывода будут распределяться между разными дисками в соответствии с установленной схемой виртуального устройства (логического виртуального тома(ов) предоставляемого RAID контроллером пользователю). Операционная система хоста обращается к данным по адресу виртуального устройства "не подозревая" что на самом деле эти запросы могут обрабатываться на нескольких дисках-участниках независимо. Это помогает снизить вероятность того, что один из дисков станет узким местом для выполнения операций ввода-вывода. Используя алгоритм меток команд в очереди (tagged command queuing) можно передавать массиву множество команд одновременно, менять их порядок в очереди для большей эффективности операций, и передавать их соответствующим дискам.
Контроллер RAID
На рисунке 3 показан контроллер RAID, который находится между интерфейсом хранилища и независимыми дисками. Этот контроллер RAID представляет хост системе одно или несколько виртуальных устройств и распределяет операции ввода-вывода между дисками-участниками. Он также отвечает за организацию очереди команд между виртуальным устройством и независимыми дисками массива.
Приложения для расслоенных массивов с независимым доступом
Массивы с независимым доступом хороши при обработке большого количества транзакций. Способность одновременно обрабатывать множество запросов ввода-вывода на нескольких дисках-участниках означает, что общая пропускная способность дискового массива с независимым доступом выше, чем у массива с параллельным доступом. Ниже приведены типы приложений, выигрывающие от режима независимого доступа.
· Системы с интенсивным I/O
o Системы, предназначенные для планирования и управления ресурсами предприятий и материального планирования (системы ERP и MRP)
o Серверы Интернет для ведения электронной коммерции
o Системы работы с клиентами
o Другие приложения для многопользовательских баз данных
· Файловые серверы с большим количеством маленьких файлов
Надежность данных через резервное копирование
В определении RAID обозначены несколько уровней, которые определяют то, каким образом достигается надежность. Общая идея заключается в применении метода резервного копирования, которые позволяют сохранить данные при отказе отдельных устройств. Для этой цели существуют два класса резервного копирования:
· Зеркальное
· Паритетное
Принцип зеркального копирования прост: производится полное копирование данных на другое устройство или в другую ячейку. Это прекрасная прямолинейная методика, которая хорошо работает но требует 100% избыточности.
Паритетное копирование
Паритетное копирование проводится с помощью вычисления значения четности (или контрольных данных - check data) данных, хранящихся на дисках-участниках массива. Четность требует ресурсы дополнительного диска для хранения информации четности. Фактически, нет необходимости выделять для информации четности дополнительный диск, и данные, и информация четности могут быть распределены по всем дискам массива. Четность рассчитывается посредством выполнения операции XOR (exclusive OR - исключающее ИЛИ). Общая идея четности XOR заключается в следующем: на любом из дисков может возникнуть сбой, и он восстанавливается посредством вычисления XOR контрольной группы данных и данных на других дисках массива. Это взаимодействие показано на рисунке 4.
Одно из преимуществ паритетного копирования заключается в том, что оно требует меньше дисков, чем зеркальное. В принципе, массив с любым количеством дисков можно защитить, используя емкость единственного диска. Например, в массиве из пяти дисков, объем одного диска выделяется для информации четности. Это не означает, что один из дисков будет полностью занят информацией четности, но будет занят объем массива, равный объему диска. Информация четности при этом может быть записана на всех дисках массива. Если выразить это в процентах, в массиве из пяти дисков служебной информацией будет занято 20% объема. Чем больше дисков в массиве, тем меньше будет процент объема, занятый служебной информацией. Если говорить о недостатках, паритетное копирование достаточно сильно нагружает систему. Каждая запись на диск требует вычисления четности. Чем больше количество дисков, тем больше необходимо памяти и тактовой частоты процессора.
Восстановление четности
Когда в массиве RAID отказывают несколько дисков, данные на них могут быть восстановлены с помощью функции XOR на основании данных, хранящихся на других дисках. По мере запроса данных хостом, сохраненные данные, информация четности и функция XOR используются для восстановления утраченных данных. Восстановленные данные идентичны потерянным данным со сбойных дисков. В какой-то момент аварийный диск заменяется другим диском массива. В этот момент начинает работать процедура называемая восстановлением четности. В процессе восстановления четности считываются данные с работающих дисков, включая информацию четности, и начинается процесс воссоздания данных на новом диске, с использованием функции XOR. (На рисунке 5 показан процесс восстановления сбойного диска массива).
Сравнение уровней RAID
Первые работы в области создания RAID, проводившиеся в 80-е годы в Беркли, определили 5 различных уровней RAID, которые обладают различными характеристиками и алгоритмами. Уже после завершения этих первый исследований был добавлен еще один, шестой уровень. Со временем был принят и широко признан еще один уровень RAID - нулевой. В следующих разделах Мы рассмотрим уровни RAID, с нулевого по шестой.
Консультативный комитет RAID
Консультативный комитет RAID (RAB - The RAID Advisory Board) - это промышленная ассоциация разработчиков и пользователей RAID, работающих вместе над совершенствованием и продвижением технологии RAID. Комитет ставит перед собой четыре основные цели:
· продвижение технологии RAID на рынок
· определение стандартизированной терминологии, классификаций и показателей
· обмен ресурсами внутри сообщества RAID
· способствование развитию смежных технологий для дальнейшего развития RAID
Консультативный комитет RAID предъявляет ряд требований к каждому уровню RAID. Мы не будем приводить все эти требования в ходе обсуждения уровней RAID, но все желающие могут узнать их на сайте Комитета www.raid-advisory.com.
RAID Уровень 0: Расслоение
Нулевой уровень RAID это просто расслоение диска, без резервного копирования. Это по существу и не RAID, потому что он не обеспечивает никакого резервного копирования. Если на нулевом уровне отказывает диск, вы теряете свои данные. Единственная возможность восстановить данные в таком случае - скопировать их с резервной копии на магнитной ленте или зеркальной копии. На нулевом уровне RAID обычно используется расслоение с независимым доступом к дискам-участникам, в отличие от метода параллельного доступа. Это позволяет одновременно обрабатывать множество операций ввода-вывода. Из-за отсутствия служебных данных расчета четности, это массив с самой высокой производительностью среди всех типов массивов. Массивы RAID нулевого уровня подходят для тех приложений, где огромное значение имеет скорость проведения операций и минимальное - защита данных. Приложения для создания мультимедийных программ, например, фильмов или видео, могут использовать массивы RAID нулевого уровня для хранения данных в процессе обработки. Среди других приложений можно привести пример высокоскоростного сбора данных, при котором данные не имеют никакой ценности, если их нельзя получить полностью на очень высокой скорости. В этом случае лучше обеспечить производительность, чтобы быстро собрать все данные, а затем сделать копии на других запоминающих средах и устройствах для защиты данных.
Отображение данных на нулевом уровне RAID
Рисунок 6 показывает, как виртуальное устройство для массива RAID нулевого уровня отображается на отдельных дисках-участниках массива. Емкость массива равна сумме емкостей составляющих его дисков.
RAID Уровень 1: Зеркальное отображение
Говоря языком RAID, RAID первого уровня - это нечетный уровень RAID. Он обеспечивает отличную защиту данных при хорошей производительности, и при считывании и записи данных не нужно проводить операции XOR (XOR - исключающее ИЛИ).
Отображение данных на первом уровне RAID
Отображение данных на уровне RAID 1 относительно просто. Что происходит с одним диском, происходит и с другим. Виртуальное устройство прямо отображается на узлах зеркальной пары. На рисунке 7 показано отображение данных на уровне RAID 1.
RAID Уровень 2: Параллельный доступ со Специализированными Дисками
Массивы RAID уровня 2 создавались, когда жесткие диски были очень дорогими и не обладали такими сложными схемами как сейчас. Определение второго уровня RAID включает схему устранения ошибок, которое осуществляется контроллером RAID. Сейчас это эффективная и недорогая схема, включенная в любой жесткий диск. Поэтому массивы RAID второго уровня уже не включаются в продукты и обычно игнорируются также и в литературе.
RAID Уровень 3: Синхронный Доступ с Выделенным Диском Четности
Массивами RAID третьего уровня называют RAID с параллельным доступом, о котором мы уже говорили. RAID 3 расслаивает данные по всем дискам массива и записывает контрольные данные на дополнительный паритетный диск. RAID 3 обычно применяется как подсистема с встроенными контроллерами RAID. Применение подсистем RAID 3 практически сошло на нет в 1999. Большинство преимуществ RAID 3, связанных с повышением производительности, сейчас достигаются с помощью кэшироваия и более высокой скорости вращения дисков. Хотя в RAID 3 практически всегда используется выделенный диск четности, это необязательно. Например, информация четности разных слоев может находиться на разных дисках массива. RAID 3 могут использоваться для больших приложений с последовательным доступом к данным, таким как производство фильмов и мультимедиа. В графических системах и системах автоматизированного проектирования CAD, как правило, тоже есть большие файлы с последовательным доступом. Выиграть от повышенной производительности при записи в массивах RAID 3 могут и системы сбора данных для научных исследований.
Отображение данных на третьем уровне RAID
Отображение данных в массивах RAID третьего уровня было показано на рисунке 2.
RAID Уровень 4: Независимый Доступ с Выделенным Диском Четности
Массивы RAID четвертого уровня это реализация RAID с независимым доступом, в которой один диск выделяется для информации четности. В отличие от RAID 3, слои данных в RAID 4 значительно больше, и они позволяют одновременно обрабатывать несколько запросов ввода-вывода. Это дает увеличение производительности при считывании, но при этом для RAID 4 особенно серьезной стала проблема записи, так как к диску четности приходится обращаться дважды в каждом цикле считывания, модификации и записи.
Отображение данных на четвертом уровне RAID
Отображение данных в массивах RAID четвертого уровня показано на рисунке 8. Как и в случае других массивов RAID, их можно разбивать на множество виртуальных дисков.
RAID Уровень 4: Проблема записи
В силу использования выделенного диска для информации четности, неотъемлемым критическим элементом RAID 4 является обработка запросов записи. Это двойной камень преткновения, учитывая уже существующую в RAID проблему записи. Поскольку RAID 4 поддерживает независимый доступ ко всем дискам, на один выделенный для информации четности диск приходится несколько операций считывания и записи контрольных данных. Зависимость всех незаконченных операций записи от выделенного диска информации четности может стать узким местом системы.
Ограничение числа дисков в RAID 4
Следует помнить о том, что по мере увеличения числа дисков в массиве RAID четвертого уровня, усугубляется и проблема записи. В некоторой степени, количество дисков в массиве определяет число операций, совмещаемых в момент времени. Например, массив из трех дисков может одновременно обрабатывать максимум 2 запроса ввода-вывода. Несмотря на использования алгоритмов ускорения процессов обработки, таких как организация очереди команд с помощью меток, головка диска может обработать только один запрос в единицу времени. Поэтому, массив из пяти дисков может поддерживать больше операций ввода-вывода, чем массив с четырьмя дисками, шестидисковый массив способен обрабатывать больше запросов, чем пятидисковый, и так далее. Может показаться, что добавление в массив новых дисков поможет распределить нагрузку и создать дополнительный параллелизм в подсистеме RAID, но это не всегда верно. Маловероятно, что отображение данных в массиве RAID и характеристики доступа приложения будут так "подогнаны", что обеспечат высоко параллельное распределение рабочей нагрузки на все диски-участники. Тем не менее, в массивах с большим количеством дисков больше и работающих головок дисков, что потенциально может несколько увеличить производительность. Однако, в RAID 4, "давка", возникающая из-за доступа к диску четности растет с увеличением количества дисков. Поэтому подсистемы RAID 4 некоторым образом ограничены в количестве дисков. Таким образом, гибкость дисковых подсистем RAID 4 и их способность к расширению ограничена. Может быть, поэтому применение RAID 4 ограничено
RAID Уровень 5: Независимый Доступ и Распределенная Четность
RAID пятого уровня это массив RAID с независимым доступом, который распределяет контрольные данные по всем дискам массива. Другими словами, там нет выделенного диска четности. Это значит, что нет того диска, который становится узким местом при записи, как в RAID 4. Задержка, связанная с циклом чтения, модификации и записи, обязательная для операций записи, при этом остается, но в RAID 5 все-таки нет отдельного диска, около которого создается "затор", как в подсистемах RAID 4.
Увеличение параллелизма в RAID 5
По мере увеличения количества дисков в массивах RAID 5, увеличивается и потенциальное число совмещаемых операций. Тут мы видим разительный контраст по сравнению с RAID 4 с узким местом в виде диска четности. Таким образом, массивы RAID 5 могут реально поддерживать большее количество дисков, чем RAID 4, что позволяет с RAID 5 добиваться большей емкости для лучшей производительности. Нужно, однако, помнить об одном: чем больше дисков, тем меньше среднее время наработки на потерю данных (MTDL - mean time to data loss), так как больше вероятность возникновения сбоя на новом диске до того, как будет восстановлен предыдущий. Кроме того, увеличение производительности сильно зависит от распределения данных по дискам-участникам и шаблона доступа приложения. Исследование работы подсистем RAID с несколькими распространенными приложениями, проведенные в Digital Equipment Corporation, показали, что 55 процентов операций ввода-вывода адресованы 20 процентам дисков массива.
XOR Диски в RAID 5
Распределение контрольных данных в массивах RAID 5 отлично подходит технологии XOR интеграции дисков. Поскольку контрольные данные хранятся на различных дисках массива, несколько операций записи могут одновременно использовать несколько совершенно разных дисков для записи данных и соответствующих им контрольных данных. Предположим, что в массиве RAID 5 восемь дисков, обновление каждой полосы включает чтение, запись и вычисление контрольных данных на двух дисках из восьми. Легко можно вообразить себе множество комбинаций одновременных операций, которые будут адресованы разным дискам, и при которых удастся избежать сражения за один и тот же диск. Конечно, нет гарантии, что такое соперничество не возникнет, но в принципе, распределение нагрузки с помощью совмещенных операций может привести к значительному росту производительности для некоторых приложений, например, программ обработки транзакций. Кроме того, пропускная способность шины, необходимая для расчета паритета в операциях XOR составляет от 33 до 50 процентов, что проводит к повышению пропускной способности массива RAID.
Отображение данных на пятом уровне RAID
Отображение данных для RAID 5, включая размещение контрольных данных, показано на рисунке 9. Нет стандарта или спецификации, определяющих то, как распределяются контрольные данные, поэтому схемы распределения контрольных данных в реализациях RAID 5 различны у разных производителей. На рисунке 9, контрольные данные для первого слоя расположены на первом диске, для второго - на втором диске, и так далее. При наличии в массиве пяти дисков, контрольные данные шестого слоя "развернутся" и будут направлены на первый диск массива.
Массивы RAID пятого уровня - одни из самых популярных решений RAID на рынке. Хотя распределение контрольных данных по нескольким дискам выглядит несколько сложным, на самом деле найти их очень просто, достаточно знать номер соответствующего слоя. Другими словами, отображение данных для виртуального устройства диктует слой, а полоса определяет местоположение контрольных данных.
Приложения для RAID пятого уровня
Оптимальным приложением для массивов RAID пятого уровня является загрузка транзакций, в которых в подсистеме RAID может перекрываться множество запросов ввода-вывода. Для RAID 5, однако, не рекомендуются приложения с большим количеством операций записи. Проблемы с насыщенным трафиком в значительной мере помогает решить кэширование с обратной записью.
RAID Уровень 6: Независимый Доступ с Двойной Четностью
В ходе обсуждения предыдущих уровней RAID речь шла о защите от потери данных только на одном из дисков массива. Величина времени наработки на потерю данных (MTDL), конечно, должно вселять в вас уверенность в подсистеме, но оно не всегда помогает защитить ценные данные, которые должны быть постоянно доступны. Шестой уровень RAID обеспечивает два уровня резервного копирования; это значит, что массив теряет два диска, и при этом продолжает функционировать. Применение RAID 6 гораздо более дорогостоящее по сравнению с другими уровнями RAID. Это происходит благодаря необходимости поддерживать два уровня сокращенных операций для регенерации и восстановления паритета. Для этого требуются более дорогие и сложные контроллеры, чем на других уровнях RAID.
RAID Уровень 6: Одномерная избыточность
Первым подходом к RAID 6 является использование двух различных алгоритмов для генерирования контрольных данных. Легче всего это реализовать, выделив для поддержки дисков с данными два диска четности. Один из дисков четности поддерживает один алгоритм четности, в то время как второй поддерживает другой. Использование двух алгоритмов называют четностью P+Q. Например, функция XOR рассчитала значение четности равное P. В этом случае, функция четности Q должна относиться к каким-то другим данным. Хорошим решением кажется использование программы исправления ошибок Рида Соломона, которая используется для жестких дисков и ленточных носителей. В случае отказа двух дисков, данные на обоих дисках восстанавливаются посредством решения двух уравнений с двумя переменными, это алгебраический прием, который можно ускорить с помощью вспомогательного процессора.
Отображение данных на RAID уровня 6 с одномерной четностью
Рисунок 10 показывает отображение данных для одномерного решения RAID 6. На диаграмме показаны два различных значения четности, одно обозначено как функция Контрольные данные А, а второе Контрольные данные Б. Оба вида контрольных данных распределяются по всем дискам массива, как в RAID 5, чтобы избежать проблемы записи как в RAID 4.
RAID Уровень 6: Двухмерная избыточность
Двухмерная избыточность основана на идее, что массивы могут быть логически организованы в матрицы с рядами и столбцами. Затем в строках и столбцах определяется ориентация данных, и контрольные данные четности рассчитываются как ортогональные векторы матрицы. При этом подходе каждая полоса данных должна принадлежать к двум ортогональным (отдельным и дискретным) слоям, и контрольные данные ни одного другого слоя в массиве не могут быть записаны в ту же ячейку. Этот подход легко представить как матрицу MxN, где диски четности M нужны для расчета четности N, и наоборот, диски четности N нужны для вычислений четности M. Общее число дисков четности, необходимое для этой схемы равно M+N. Объем служебной информации четности для этого типа массива уменьшается, когда число строк и столбцов равно, а размер массива увеличивается. Например, для массива из девяти дисков 3x3 нужны 6 дисков четности для служебной информации, занимающей 66 процентов объема. Однако, когда в массиве 100 дисков при конфигурации 10x10, необходимы 20 дисков четности, а процент служебной информации снижается до 20. Одним из преимуществ двухмерного подхода является то, что тот же алгоритм может использоваться для расчета контрольных данных. Это значительно упрощает математические операции, используемые для сокращенных операций, таких как восстановление данных и восстановление четности. Можно использовать одну и ту же программу управления массивом или тот же вспомогательный процессор.
Отображение данных на RAID уровня 6 с двухмерной четностью
Рисунок 11 показывает отображение данных для двухмерной подсистемы RAID уровня 6. Организация показанной матрицы демонстрирует ориентацию диска. Схема необязательно точна, так как матрица строится на основании экстентов, а не дисков. Кроме того, нет никаких правил, которые определяли бы структуру таблицы. Вообще, нет необходимости строить матрицу как ряды независимых массивов. Это требовало бы идентичных конфигураций размеров экстентов и глубины слоев в обоих массивах. Вместо этого было бы легче построить таблицу из экстентов, принадлежащих одному и тому же массиву.
Сочетание уровней RAID
Считая, что программы управления массивами постоянно находятся в подсистеме RAID, а также в программах управления томами хоста или контроллере ввода-вывода хоста, кажется логичным рассмотрение возможности наложения друг на друга различных слоев выполняемых RAID функций. Оказывается, что сочетание зеркального копирования и расслоения позволяет и увеличить производительность, и обеспечить избыточность. Чтобы использовать одновременно несколько уровней RAID нет необходимости применять RAID в разных продуктах. На рынке существует несколько решений подсистем RAID, которые обеспечивают многослойность RAID внутри одной подсистемы.
Задачи многослойных массивов RAID
Все уровни RAID, от нулевого до шестого, представляют собой компромисс между ценой, производительностью и избыточностью. Сочетание разных уровней RAID позволяет использовать относительно сильную сторону одного уровня, чтобы компенсировать или преодолеть недостаток другого. Таким образом можно было бы создать гибридный массив RAID с идеальными характеристиками. Сильные и слабые стороны разных уровней RAID приведены в таблице.
Таблица. Достоинства и недостатки разных уровней RAID
Уровень RAID |
Относительно сильная сторона |
Относительно слабая сторона |
|
RAID 0 |
Производительность |
Отсутствие избыточности |
|
RAID 1 |
Избыточность без четности |
Цена |
|
RAID 3 |
Минимальная задержка записи |
Отсутствие совмещения операций |
|
RAID 4 |
Совмещение небольших операций ввода-вывода |
Узкое место диска четности |
|
RAID 5 |
Совмещение небольших операций ввода-вывода |
Задержка записи |
Многослойные массивы требуют дополнительного уровня виртуализации устройства, и могут привести к путанице в терминологии. Мы будем называть уровень RAID, непосредственно управляющий дисками-участниками, массивом наименьшей позиции, а уровень RAID, наиболее приближенный к центральному процессору компьютера, массивом наивысшей позиции. Массив наивысшей позиции является полностью виртуальным и не включает никаких аппаратных средств. Другими словами, этот уровень не является реальным хранилищем данных. Еще один момент: массив наивысшей позиции представляется как единое виртуальное устройство или единый массив. Низшая позиция фактически состоит из нескольких физических массивов: по одному на каждый виртуальный массив высшей позиции. Это показано на рисунке 12.
Можно придумать множество интересных комбинаций многослойных массивов, но единственным реально распространенным решением является сочетание расслоение RAID нулевого уровня с зеркальным копированием RAID 1.
Сочетание Расслоения и Зеркального копирования
Комбинацию из RAID первого и нулевого уровней называют RAID 0+1 или RAID 10. Как мы увидим дальше, у нее есть несколько интересных преимуществ. В результате сочетания скорости расслоения RAID 0 и зеркального копирования RAID 1 мы получаем быструю подсистему RAID, без проблем записи и с отличной производительностью. На рисунке 13 показана конфигурация RAID 0+1/ RAID 10, где компонент RAID 0 занимает наивысшую позицию, а RAID 1 низшие позиции.
Заметьте, что этот массив может "позволить" себе потерю нескольких дисков одновременно, если они не входят в одну и ту же зеркальную пару. Однако массив не гарантирует защиту данных в случае сбоя двух дисков одной зеркальной пары, как это делает RAID 6. Кроме того, цена такого массива несколько выше стоимости массивов с четностью из-за того, что служебные данные при резервировании дисков составляют 100 процентов. Массивы RAID 0+1/ RAID 10 становятся все более популярными по следующим причинам:
· Сокращенные операции не производятся с пониженной производительностью
o Проблема записи минимальна по сравнению с четными массивами RAID
o Массив с x виртуальных дисков-участников может пережить отказ до x дисков
o Емкость массива возрастает без ущерба для среднего времени до потери данных (MTDL)
o MTDL зависит от отдельного диска, а не их совокупности
· Массивы легко применять для множества приложений
Список используемой литературы
1.http://rlab.ru/doc/raid_arrays.html
2.http://ru.wikipedia.org/wiki/RAID
3.http://www.raidshop.ru/article_info.php?articles_id=33
4.http://www.compress.ru/Archive/CP/2003/4/37/
5.http://docstore.mik.ua/press/skpress/pc_mag/01s978.htm
6.http://www.hardline.ru/3/23/1330
7.http://www.ixbt.com/storage/mylex_prod.html
8.http://www.rink.ru/raid/press/products.HTM
Размещено на Allbest.ru
Подобные документы
Понятие и назначение, основы создания RAID–массивов, принципы их работы и законы функционирования. Классификация и разновидности систем RAID, их отличительные признаки, оценка преимуществ и недостатков каждого вида. Тестовая разработка RAID-массива.
курсовая работа [1,7 M], добавлен 24.04.2010Аппаратные и программные RAID-массивы. Расчет объема массива. Временные затраты на расчет и запись контрольных сумм. Пример распределения файлов по JBOD-массиву. Вероятности отказа каждого диска в массиве. Сравнение стандартных уровней RAID-массивов.
курсовая работа [3,0 M], добавлен 28.03.2011RAID - масив з декількох дисків, керованих контролером, взаємопов'язаних швидкісними каналами. Рівні RAID масивів: переваги та недоліки. Кількість жорстких дисків в комбінованих масивах. Розподіл файлів по JBOD-масиву. Мережеві системи зберігання даних.
контрольная работа [1,6 M], добавлен 15.03.2013Проектирование программы объединения двух накопителей в один узел памяти для увеличения ее объёма и скорости доступа к ней. Создание RAID-массива нулевого уровня как средство повышения быстродействия дисковой подсистемы, его преимущества и недостатки.
дипломная работа [1,0 M], добавлен 29.12.2014Производители жестких дисков и их классификация. Повышение плотности записи на винчестере. Дисковые массивы, некоторые аспекты реализации RAID-систем. Файловые системы FAT 16, FAT 32, NTFS. Диски со встроенным шифрованием. Форматирование жесткого диска.
книга [2,4 M], добавлен 10.09.2013Защита информации, хранящейся в компьютерных системах. Причины потерь данных. Процесс их восстановления. Многоуровневое дублирование. Базовые методы пофайлового резервного копирования. Усовершенствование инкрементного алгоритма. Технология и уровни RAID.
реферат [372,4 K], добавлен 24.12.2013Состав и назначение рабочей и сетевой станции. Основы организации и хранения данных на HDD накопителях, использование системы RAID в файловом сервере. Типичная конфигурация сети Ethernet топологии "звезда". Использование оптоволокна для передачи данных.
курсовая работа [205,6 K], добавлен 27.12.2014Условное разделение частей ЭВМ на основные и периферийные устройства. Использование последовательной передачи данных в интерфейсе винчестеров Serial ATA. Порядок установки и конфигурирование нового контроллера, модернизация BIOS, основы технологии RAID.
курсовая работа [1,3 M], добавлен 21.05.2009Порівняльна характеристика систем зберігання даних MaxTronik i Qsan, дослідження їх структури й принципу роботи. Типи носіїв даних. Інтерфейси систем зберігання даних та причини їх втрати. Технологія та рівні RAID. Особливості продуктів MaxTronic та Qsan.
курсовая работа [1,6 M], добавлен 20.11.2014Анализ принципа действия накопителей на жестких магнитных дисках персональных компьютеров. Перфокарта как носитель информации в виде карточки из бумаги, картона. Основные функции файловой системы. Способы восстановления информации с RAID-массивов.
дипломная работа [354,2 K], добавлен 15.12.2012