Технологія дискових масивів RAID
Порядок використаної технології в роботі обчислювальної системи. Принцип, за яким реалізується технологія. Мінімальна кількість дисків для створення масиву. Аналіз зміни показників надійності шляхом застосування різноманітних типів RAID масивів.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | украинский |
Дата добавления | 22.04.2011 |
Размер файла | 2,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1. Розвиток технології виробництва та характеристик елементів ПК
1.1 Передумови появи технології масивів RAID
Уперше термін "RAID-массив" з'явився в 1987 році, коли американські дослідники Паттерсон, Гібсон і Катц з Каліфорнійського університету Берклі у своїй статті "Надмірний масив недорогих дисків" ("A Case for Redundant Arrays of Inexpensive Discs, RAID") описали, яким чином можна об'єднати декілька дешевих жорстких дисків в один логічний пристрій так, щоб в результаті підвищувалися місткість і швидкодія системи, а відмова окремих дисків не призводила до відмови усієї системи.
З моменту виходу статті пройшло вже більше 20 років, але технологія побудови RAID - масивів не втратила актуальності і сьогодні. Єдине, що змінилося відтоді, - це розшифровка абревіатури RAID. Річ у тому, що спочатку RAID - масиви будувалися зовсім не на дешевих дисках, тому слово Inexpensive (недорогі) поміняли на Independent (незалежні), що більше відповідало дійсності.
RAID - це надмірний масив незалежних дисків (Redundant Arrays of Independent Discs), на який покладається завдання забезпечення відмовостійкості і підвищення продуктивності. Відмовостійкість досягається за рахунок надмірності. Тобто частина місткості дискового простору відводиться для службових цілей, стаючи недоступною для користувача.
Підвищення продуктивності дискової підсистеми забезпечується одночасною роботою декількох дисків, і в цьому сенсі чим більше дисків в масиві (до певної межі), тим краще.
1.2 Порядок використаної технології в роботі обчислювальної системи
Усі сучасні материнські плати оснащені інтегрованим RAID -контролером, а топові моделі мають навіть по декілька інтегрованих RAID -контролерів. Наскільки інтегровані RAID - контролери затребувані домашніми користувачами - питання окреме. У будь-якому випадку сучасна материнська плата надає користувачеві можливість створення RAID - масиву з декількох дисків
Спільну роботу дисків в масиві можна організувати за допомогою або паралельного, або незалежного доступу. При паралельному доступі дисковий простір розбивається на блоки (смужки) для запису даних. Аналогічно інформація, що підлягає запису на диск, розбивається на такі ж блоки. При записі окремі блоки записуються на різні диски, причому запис декількох блоків на різні диски відбувається одночасно, що і призводить до збільшення продуктивності в операціях запису. Потрібна інформація також прочитується окремими блоками одночасно з декількох дисків, що теж сприяє росту продуктивності пропорційно кількості дисків в масиві.
Слід зазначити, що модель з паралельним доступом реалізується тільки за умови, що розмір запиту на запис даних більше розміру самого блоку. Інакше здійснювати паралельний запис декількох блоків практично неможливо. Представимо ситуацію, коли розмір окремого блоку складає 8 Кбайт, а розмір запиту на запис даних - 64 Кбайт. В цьому випадку початкова інформація поділяється на вісім блоків по 8 Кбайт кожен. Якщо є масив з чотирьох дисків, то одночасно можна записати чотири блоки, або 32 Кбайт, за один раз. Очевидно, що в розглянутому прикладі швидкість запису і швидкість читання виявляться в чотири рази вище, ніж при використанні одного диска. Це справедливо лише для ідеальної ситуації, проте розмір запиту далеко не завжди кратний розміру блоку і кількості дисків в масиві.
Якщо ж розмір записуваних даних менше розміру блоку, то реалізується принципово інша модель - незалежний доступ. Більше того, ця модель може використовуватися і у тому випадку, коли розмір записуваних даних більше розміру одного блоку. При незалежному доступі усі дані окремого запиту записуються на окремий диск, тобто ситуація ідентична роботі з одним диском. Перевага моделі з незалежним доступом в тому, що при одночасному вступі декількох запитів на запис (читання) усі вони виконуватимуться на окремих дисках незалежно один від одного. Подібна ситуація типова, наприклад, для серверів. Та щоб сумістити різні типи інтерфейсів жорстких дисків потрібні окремі спеціалізовані RAID контролери (Мал. 1).
Мал. 1 - Знімний контролер RAID
Відповідно до різних типів доступу існують і різні типи RAID - масивів, які прийнято характеризувати рівнями RAID. Окрім типу доступу, рівні RAID розрізняються способом розміщення і формування надмірної інформації. Надмірна інформація може або розміщуватися на спеціально виділеному диску, або розподілятися між усіма дисками. Способів формування цієї інформації досить багато. Простий з них - це повне дублювання (100-процентна надмірність), або
Зеркалювання (забезпечення ідентичної копії). Крім того, використовуються коди з корекцією помилок, а також обчислення парності.
Сферою застосування RAID - масивів являються, як правило, системи зберігання даних і сервера.
2. Опис технології
2.1 Принцип, за яким реалізується технологія
Технологія реалізується за багатьма принципами, в залежності від того, на скільки сильно потрібно забезпечити надійність даних, швидкість їх читання\запису, та яка комплектація пристроїв є у нас в наявності!
Зазвичай на материнській платі є вмонтований RAID контролер, у разі відсутності його можна приладнати окремо в PCI слот, з серверами ситуація дещо складніша.
Найпростіший із способів - JBOD (Just a Bunch of Disks). Два вінчестери склеєні в один послідовно, інформація записується спочатку на один, а потім на інший диск без розбиття її на шматки і блоки. З двох накопичувачів по 200 Гбайт ми робимо один на 400 Гбайт, працюючий практично з тією ж, а в реальності з трохи меншою швидкістю, що і кожен з двох дисків.
JBOD є часткою випадком масиву нульового рівня, RAID - 0. Зустрічається також інший варіант назви масивів цього рівня - stripe (смужка), повне найменування - Striped Disk Array without Fault Tolerance. Цей варіант теж припускає об'єднання n дисків в один з об'ємом, збільшеним в n разів, але диски об'єднуються не послідовно, а паралельно, і інформація на них записується блоками (об'єм блоку задає користувач при формуванні RAID -массива).
Тобто у разі, якщо на два накопичувачі, що входять в масив RAID, - 0, треба записати послідовність цифр 123456, контролер розділить цей ланцюжок на дві частини - 123 і 456 - і першу запише на один диск, а другу - на іншій. Кожен диск може передавати дані. ну, нехай із швидкістю 50 Мбайт/з, а сумарна швидкість двох дисків, дані з яких беруться паралельно, складає 100 Мбайт/c. Таким чином, швидкість роботи з даними повинна збільшитися в n разів (реально, звичайно, ріст швидкості менший, оскільки втрати на пошук даних і на передачу їх по шині ніхто не відміняв). Але цей приріст дається не просто так : при поломці хоча б одного диска інформація з усього масиву втрачається.
2.2 Основні характеристики різних технологій
Каліфорнійський університет у Берклі представив наступні рівні специфікації RAID, які були прийняті як стандарт де-факто :
* RAID 0 представлений як дисковий масив підвищеної продуктивності і меншої відмовостійкості.
* RAID 1 визначений як дзеркальний дисковий масив.
* RAID 2 зарезервований для масивів, які застосовують код Хемминга.
* RAID 3 і 4 використовують масив дисків з чергуванням і виділеним диском парності.
* RAID 5 використовують масив дисків з чергуванням і "невиділеним диском парності".
* RAID 6 використовують масив дисків з чергуванням і двома незалежними "читаннями" блоків.
* RAID 10 - RAID 0, побудований з RAID 1 масивів
* RAID 50 - RAID 0, побудований з RAID 5
* RAID 60 - RAID 0, побудований з RAID 6
Проте вже з'явився варіант RAID 7, та він не є окремим рівнем RAID а був створений на заказ окремої фірми Storage Computer Corporation.
Рівні RAID
RAID 0
(striping - "чергування") - дисковий масив з двох або жорсткіших дисків з відсутністю резервування. Інформація розбивається на блоки даних (Ai) і записується на обоє/декілька дисків одночасно. (Мал. 3.1)
Мал. 3.1. Організація масиву типу RAID 0
RAID 1
Перший по-справжньому "надмірний" масив (Мал. 3.2)(і перший RAID, що з'явився на світ) - RAID - 1. Його друга назва - mirror (дзеркало) - пояснює принцип роботи : усі відведені під масив диски розбиваються на пари, а інформація прочитується і записується відразу на обидва диски. Виходить, що у кожного з дисків в масиві є точна копія. У такій системі зростає не лише надійність зберігання даних, але і швидкість їх читання (читати можна відразу з двох вінчестерів), хоча швидкість запису залишається такою ж, як і у одного накопичувача.
Як можна здогадатися, об'єм такого масиву дорівнюватиме половині суми об'ємів усіх вінчестерів, що входять в нього. Мінус такого рішення - жорстких дисків потрібно в два рази більше. Та зате надійність цього масиву реально навіть не дорівнює подвійній надійності поодинокого диска, а набагато вище за це значення. Вихід з ладу двох вінчестерів в течію, ну скажімо, маловірогідний, якщо в справу не втрутився, приміром, блок живлення. В той же час будь-яка розсудлива людина, побачивши, що один диск в парі вийшов з ладу, тут же його замінить, і навіть якщо відразу після цього віддасть кінці другий диск, інформація нікуди не подінеться, адже вона автоматично копіюється на новий диск, яким заміняють той, що вийшов з ладу.
Мал. 3.2. Організація масиву типу RAID 1
Дзеркало на багатьох дисках - RAID 1+0 або RAID 0+1. Під RAID 1+0 мають на увазі варіант RAID 10, коли два RAID 1 об'єднуються в RAID 0. Він називається RAID 0+1, і "зовні" є той же RAID 10. Достоїнства і недоліки такі ж, як і у рівня RAID 0. Як і в інших випадках, рекомендується включати в масив диски гарячого резерву з розрахунку один резервний на п'ять працюючих.
RAID 2
У масивах такого типу диски діляться на дві групи - для даних і для кодів корекції помилок, причому якщо дані зберігаються на n дисках, то для зберігання кодів корекції потрібне n ? 1 дисків. Дані записуються на відповідні диски так само, як і в RAID 0, вони розбиваються на невеликі блоки по числу дисків, призначених для зберігання інформації. Диски, що залишилися, зберігають коди корекції помилок, по яких у разі виходу якого-небудь жорсткого диска з ладу можливе відновлення інформації. Метод Хеммінга давно застосовується в пам'яті типу ECC і дозволяє на льоту виправляти одноразові і виявляти двократні помилки. (Мал 3.2)
Мал. 3.2. Організація масиву типу RAID 2
ECC (англ. error - correcting code, код корекції помилок) - дані, що приєднуються до кожного передаваного сигналу, дозволяють приймаючій стороні визначити факт збою і (в деяких випадках) виправити несуттєву помилку.
ECC використовується в зберіганні даних
Коди Хеммінга.
Систематичні коди
Систематичні коди утворюють велику групу серед блокових, роздільних кодів (у яких усі символи можна розділити на перевірочні і інформаційні). Особливістю систематичних кодів є те, що перевірочні символи утворюються в результаті лінійних операцій над інформаційними символами. Крім того, будь-яка дозволена кодова комбінація може бути отримана в результаті лінійних операцій над набором лінійно незалежних кодових комбінацій.
Коди, що Самоконтролюються
Коди Хэммінга є кодами, що самоконтролюються, тобто коди, що дозволяють автоматично виявляти помилки при передачі даних. Для їх побудови досить приписати до кожного слова один додатковий (контрольний) двійковий розряд і вибрати цифру цього розряду так, щоб загальна кількість одиниць в зображенні будь-якого числа була, наприклад, парним. Поодинока помилка в якому-небудь розряді передаваного слова (у тому числі, можливо, і в контрольному розряді) змінить парність загальної кількості одиниць. Лічильники по модулю 2, що підраховують кількість одиниць, які містяться серед двійкових цифр числа, можуть давати сигнал про наявність помилок.
При цьому неможливо дізнатися, в якому саме розряді сталася помилка, і, отже, немає можливості виправити її. Залишаються непоміченими також помилки, що виникають одночасно в двох, в чотирьох або взагалі в парній кількості розрядів. Втім, подвійні, а тим більше чотирикратні помилки вважаються маловірогідними.
RAID 3
У масиві RAID 3 з n дисків дані розбиваються на блоки розміром 1 байт і розподіляються по n ? 1 дискам. Ще один диск використовується для зберігання блоків парності. У RAID 2 для цієї мети застосовувався n ? 1 диск, але велика частина інформації на контрольних дисках використовувалася для корекції помилок на льоту, тоді як більшість користувачів задовольняє просте відновлення інформації у разі поломки диска, для чого вистачає інформації, що уміщається на одному виділеному жорсткому диску. (Мал 3.3)
Мал. 3.3. Організація масиву типу RAID 3
Відмінності RAID 3 від RAID 2: неможливість корекції помилок на льоту і менша надмірність.
RAID 4 та 5
RAID 4 схожий на RAID 3 (Мал 3.4), але відрізняється від нього тим, що дані розбиваються на блоки, а не на байти. Таким чином, вдалося частково "перемогти" проблему низької швидкості передачі даних невеликого об'єму. Запис же робиться повільно через те, що парність для блоку генерується при записі і записується на єдиний диск. З систем зберігання широкого поширення RAID - 4 застосовується на облаштуваннях зберігання компанії NetApp (NetApp FAS), де його недоліки успішно усунені за рахунок роботи дисків в спеціальному режимі групового запису, визначуваному використовуваною на пристроях внутрішньою файловою системою WAFL.
Write Anywhere File Layout (WAFL) - "Файлова структура із записом всюди" - внутрішня високопродуктивна файлова система, використовувана в спеціалізованій ОС Data ONTAP в мережевих системах зберігання даних компанії NetApp.
У WAFL використовується спосіб, при якому одного разу записані блоки даних надалі не перезаписуються, а при необхідності перезапису блоку даних усередині файлу, з пулу вільних блоків файлової системи виділяється порожні блоки, в які і спрямовується запис, після чого в "таблиці розміщення файлів" переставляється покажчик із старих блоків на новий. Такий спосіб організації запису дозволяє використати дуже просту і ефективну схему створення снепшотів, тобто миттєвих "знімків стану" даних.
Мал. 3.4. Організація масивів типу RAID 4 та 5
Попри те, що WAFL традиційно прийнято вважати "файловою системою", ряд особливостей її роботи і організації даних в ній є унікальним, і незвичайними для того, що прийнято вважати властивим традиційній файловій системі
RAID 5EE
Примітка: підтримується не в усіх контролерах RAID level - 5EE подібний до масиву RAID - 5E, але з ефективнішим використанням резервного диска і коротшим часом відновлення. Подібно до RAID level - 5E, цей рівень RAID - масиву створює ряди цих і контрольних сум в усіх дисках масиву. Масив RAID - 5EE має поліпшений захист і продуктивність. При застосуванні RAID level - 5E, місткість логічного тому обмежується місткістю двох фізичних вінчестерів масиву (один для контролю, один резервний). Резервний диск є частиною масиву RAID level - 5EE. Проте, на відміну від RAID level - 5E, що використовує неподілене вільне місце для резерву, в RAID level - 5EE в резервний диск вставлені блоки контрольних сум, як показується далі на прикладі. Це дозволяє швидше перебудовувати дані при поломці фізичного диска. При такій конфігурації, ви не зможете використати його з іншими масивами. Якщо вам потрібний запасний диск для іншого масиву, вам слід мати ще один резервний вінчестер. RAID level - 5E вимагає як мінімум чотирьох дисків і, залежно від рівня прошивки і їх місткості, підтримує від 8 до 16 дисків. RAID level - 5E має певну прошивку. Примітка: для RAID level - 5EЕ, ви можете використати тільки один логічний том в масиві.
RAID 6
RAID 6 - схожий на RAID 5, але має більш високу міру надійності - під контрольні суми виділяється місткість 2-х дисків, розраховуються 2 суми по різних алгоритмах. Вимагає потужніший RAID -контроллер. Забезпечує працездатність після одночасного виходу з ладу двох дисків - захист від кратної відмови. Для організації масиву вимагається мінімум 4 диска. (Мал 3.5)
Мал. 3.5. Організація масиву типу RAID 6
RAID 7
RAID 7 - зареєстрована торгова марка компанії Storage Computer Corporation, окремим рівнем RAID не є. Структура масиву така: на n ? 1 дисках зберігаються дані, один диск використовується для складування блоків парності. Запис на диски кешуєтся з використанням оперативної пам'яті, сам масив вимагає обов'язкового блоку безперебійного живлення;
RAID 10
RAID 10 - зеркальований масив, дані в якому записуються послідовно на декілька дисків, як в RAID 0. Ця архітектура є масивом типу RAID 0, сегментами якого замість окремих дисків є масиви RAID 1. Відповідно, масив цього рівня повинен містити як мінімум 4 диски. RAID 10 об'єднує в собі високу відмовостійкість і продуктивність.
Нинішні контролери використовують цей режим за умовчанням для RAID 1. Тобто, один диск основний, другий, - дзеркало, читання даних здійснюється з них по черзі. Зараз можна вважати, що RAID 10 і RAID 1+0 - ця просто різна назва одного і того ж методу зеркалювання дисків. Твердження, що RAID 10 є найнадійнішим варіантом для зберігання даних, помилкове, оскільки, попри те, що для цього рівня RAID можливе збереження цілісності даних при виході з ладу половини дисків. (Мал 3.6)
Мал. 3.6. Організація масиву типу RAID 10
2.3 Основні переваги і недоліки різних технологій
RAID 0
Перевага
За рахунок цього істотно підвищується продуктивність (від кількості дисків залежить кратність збільшення продуктивності).
Недолік
Страждає надійність усього масиву (при виході з ладу будь-якого з тих, що входять в RAID 0 вінчестерів уся інформація, що міститься на них, стає недоступною). Надійність RAID 0 свідомо нижче надійності будь-якого з дисків окремо і падає зі збільшенням кількості що входять в RAID 0 дисків, і відмова будь-якого з дисків призводить до непрацездатності усього масиву.
RAID 1
Переваги
Забезпечує прийнятну швидкість запису і виграш за швидкістю читання при розпаралелюванні запитів.
Має високу надійність - працює до тих пір, поки функціонує хоч би один диск в масиві. Вірогідність виходу з ладу відразу двох дисків дорівнює вірогідності відмови кожного диска. На практиці при виході з ладу одного з дисків слід терміново вживати заходи - знову відновлювати надмірність. Для цього з будь-яким рівнем RAID (окрім нульового) рекомендують використати диски гарячого резерву. Гідність такого підходу - підтримка постійної доступності.
Недолік
Полягає в тому, що доводиться виплачувати вартість двох жорстких дисків, отримуючи корисний об'єм одного жорсткого диска (класичний випадок, коли масив складається з двох дисків).
RAID 2
Недолік масиву RAID 2 в тому, що для його функціонування потрібна структура з майже подвійної кількості дисків, тому такий вид масиву не отримав поширення.
RAID 3
Переваги
* висока швидкість читання і запису даних
* мінімальна кількість дисків для створення масиву рівна трьом.
Недоліки
* масив цього типу хороший тільки для однозадачної роботи з великими файлами, оскільки час доступу до окремого сектора, розбитого по дисках, рівно максимальному з інтервалів доступу до секторів кожного з дисків. Для блоків малого розміру час доступу набагато більше часу читання.
* велике навантаження на контрольний диск, і, як наслідок, його надійність сильно падає в порівнянні з дисками, що зберігають дані.
RAID 4
Недоліком рівнів RAID від 2-го до 4-го являється неможливість робити паралельні операції запису, оскільки для зберігання інформації про парність використовується окремий контрольний диск. RAID 5 не має цього недоліку. Блоки даних і контрольні суми циклічно записуються на усі диски масиву, немає асиметричності конфігурації дисків. Під контрольними сумами мається на увазі результат операції XOR(що виключає або). Xor має особливість, яка застосовується в RAID 5, яка дає можливість замінити будь-який операнд результатом, і застосувавши алгоритм xor, отримати в результаті бракуючий операнд. Наприклад: a xor b = c (де a, b, c - три диски рейд-массива), у випадку якщо a відмовить, ми можемо отримати його, поставивши на його місце c і провівши xor між c і b: c xor b = a. Це застосовно незалежно від кількості операндів : a xor b xor c xor d = e. Якщо відмовляє c тоді e встає на його місце і провівши xor в результаті отримуємо c: a xor b xor e xor d = c. Цей метод по суті забезпечує відмовостійкість 5 версій. Для зберігання результату xor потрібно всього 1 диск, розмір якого дорівнює розміру будь-якого іншого диска в raid.
RAID 5
Перевага
RAID5 отримав широке поширення, в першу чергу, завдяки своїй економічності. Об'єм дискового масиву RAID5 розраховується по формулі (n - 1)*hddsize, де n - число дисків в масиві, а hddsize - розмір найменшого диска. Наприклад, для масиву з 4-х дисків по 80 гігабайт загальний об'єм буде (4 - 1) * 80 = 240 гігабайт. На запис інформації на тому RAID 5 витрачаються додаткові ресурси і падає продуктивність, оскільки потрібно додаткові обчислення і операції запису, зате при читанні (в порівнянні з окремим вінчестером) є виграш, тому що потоки даних з декількох дисків масиву можуть оброблятися паралельно. Продуктивність RAID 5 помітно нижче, особливо на операціях типу Random Write (записи в довільному порядку), при яких продуктивність падає на 10-25% від производител від продуктивності RAID 1 (чи RAID 10), оскільки вимагає більшої кількості операцій з дисками (кожна операція запису сервера замінюється на контроллері RAID на три - одну операцію читання і дві операції запису).
Недолік
При виході з ладу одного з дисків - увесь том переходить в критичний режим (degrade), усі операції запису і читання супроводжуються додатковими маніпуляціями, різко падає продуктивність. При цьому рівень надійності знижується до надійності RAID - 0 з відповідною кількістю дисків (тобто в n разів нижче надійності поодинокого диска). Якщо до повного відновлення масиву станеться вихід з ладу, або виникне невідновна помилка читання хоч би на ще одному диску, то масив руйнується, і дані на нім відновленню звичайними методами не підлягають. Слід також взяти до уваги, що процес RAID Reconstruction (відновлення даних RAID за рахунок надмірності) після виходу з ладу диска викликає інтенсивне навантаження читання з дисків упродовж багатьох годин безперервно, що може спровокувати вихід якого-небудь з дисків, що залишилися, з ладу в цей найменш захищений період роботи RAID, а також виявити раніше невиявлені збої читання в масивах cold data (даних, до яких не звертаються при звичайній роботі масиву, архівні і малоактивні дані), що підвищує ризик збою при відновленні даних. Мінімальна кількість використовуваних дисків рівна трьом.
RAID 5EE
Переваги
* 100% захист даних
* Велика місткість фізичних дисків в порівнянні з RAID - 1 або RAID - 1E
* Велика продуктивність в порівнянні з RAID - 4
* Швидше відновлення RAID в порівнянні з RAID -5Е
Недоліки
* Нижча продуктивність, ніж в RAID - 1 або RAID - 1E
* Підтримка тільки одного логічного тому на масив
* Неможливість спільного використання резервного диска з іншими масивами
* Підтримка не усіх контролерів
RAID 6
Недолік
Звичайне використання RAID - 6 викликає приблизно 10-15% падіння продуктивності дискової групи, в порівнянні з аналогічними показниками RAID - 5, що викликано великим об'ємом обробки для контролера (необхідність розраховувати другу контрольну суму, а також прочитувати і перезаписувати більше дискових блоків при записі кожного блоку).
RAID 7
Недолік
У разі перебоїв з живленням відбувається ушкодження даних.
RAID 10
Недолік
Безповоротне руйнування масиву відбувається при виході з ладу вже двох дисків, якщо вони знаходяться в одній дзеркальній парі.
3. Індивідуально - пошукова робота
3.1 Аналіз зміни показників надійності, шляхом застосування різноманітних типів RAID масивів
обчислювальна система масив диск
Головними характеристиками дискового накопичувача є його місткість, швидкодія і надійність. Необхідна місткість диска (або дисків) визначається задачами користувачів мережі і вимогами до розвитку системи.
Показниками швидкодії диска є дві характеристики - середній час доступу до диска, залежний від часу переміщення головок між доріжками диска, і швидкість передачі даних між диском і контроллером диска. Крім того, для оцінки продуктивності дисків, що використовуються для зберігання баз даних, зручною характеристикою є швидкість транзакцій, звичайно вимірювана в кількості введення-виведень в секунду. Пропоновані на ринку диски мають в основному два типи інтерфейсу між диском і контроллером диска: IDE і SCSI (з його різновидами - SCSI-2 і FastSCSI-2). Необхідну швидкість передачі даних забезпечує інтерфейс SCSI, до того ж він дозволяє підключити до одного контроллера до 7 дисків, що не може інтерфейс IDE. Тому для файл-серверів в мережах з кількістю користувачів більше 10 бажано використовувати диски з інтерфейсом SCSI. Бажано, щоб контроллер диска мав велику кеш-пам'ять, в цьому випадку обмін з дисками значно швидшає.
Для забезпечення надійного зберігання даних на дисках у файл-серверах широко використовуються RAID-масиви. Для комп'ютера дисковий масив представляється одним диском.
Рівень RAID-0 підвищує швидкість доступу до даних за рахунок їх розщеплювання. Загальний для дискового масиву контроллер передає дані паралельно на всі диски, при цьому перший байт даних записується на перший диск, а другий байт - на другій і т.д. Час доступу при виконанні однієї операції уведення-виведення скорочується за рахунок одночасності операцій запису/читання по всіх дисках масиву. В паралельному дисковому масиві повинен використовуватися спеціальний контроллер, що забезпечує синхронізацію дисководів. Зрозуміло, що надійність цієї схеми в порівнянні з одиночним диском в загальному випадку не тільки не підвищується, а стає нижчим, дійсно вірогідність відмови зростає, через збільшення числа дисків. Зате рівень RAID не створює надмірності даних в дисковому масиві.
РівеньRAID-1 реалізує дзеркальний запис на диски. Резервний диск дублює кожний основний диск. Якщо основний диск виходить з ладу, дзеркальний продовжує зберігати дані. Цей спосіб характеризується високою супроводжуваною надійністю, проте, високою надмірністю. Очевидно, що швидкість доступу до даних не підвищується.
Рівень RAID-2 використовується у великих комп'ютерах і є способом побітного розшарування, який дозволяє збільшити швидкість доступу до даних за рахунок розпаралелювання запиту.
В реализації RAID-3 використовується масив з N дисків, запис на N-1 з них проводиться паралельно з побайтним (або блоковим) розщеплюванням, як в методі RAID-0. N-ний диск використовується для запису контрольної інформації про парність. Диск парності є резервним. Якщо який-небудь диск виходить з ладу, то дані решти дисків плюс дані про парність резервного диска дозволяють відновити втрачену інформацію. Рівень RAID-3 підвищує як надійність, так і швидкість обміну інформацією, проте володіє надмірністю, хоча і меншої, ніж рівень RAID-1.
Рівень RAID-4 також використовує один резервний диск для запису контрольної інформації про парність, але розщеплювання відбувається на рівні більш масивних одиниць даних - на рівні секторів. За рахунок цього може відбуватися незалежний обмін з кожним диском. Швидкість передачі даних не вище, ніж у окремого диска, проте, оскільки диски працюють незалежно, дані можуть прочитуватися одночасно зі всіх дисків. Це робить можливим одночасне виконання декількох операцій уведення-виведення. Основним недоліком рівня RAID-4 є низька швидкість запису. Інформація про парність повинна коректуватися кожного разу, коли виконується операція запису. Старі дані і стара інформація про парність спочатку повинні бути зчитані, а потім з'єднані з новими даними, щоб отримати нову інформацію про парність. Потім вона повинна бути записана на диск парності. Причиною значного зменшення швидкості в методі RAID-4 є те, що після читання старих даних і старої інформації про парність кожний диск повинен обернутися на один повний оборот до того, як нові дані і інформація про парність можуть бути записані. Крім того, при паралельному виконанні декількох операцій уведення-виведення можуть виникати черги при зверненні до диска з контрольною інформацією.
В рівні RAID-5 використовується метод, аналогічний RAID-4, але дані про контроль парності розподіляються по дисках масиву. Кожна команда запису ініціює ту ж послідовність зчитування-модифікація-запис в декількох дисках, як і в методі RAID-4. Оскільки інформація про парність може бути зчитані і записаний на декілька дисків одночасно, вірогідність виникнення черг до дисків зменшується, а, отже, швидкість запису в порівнянні з рівнем RAID-4 збільшується. Проте вона все ще набагато нижче за швидкість окремого диска, методу RAID-1 або RAID-3.
Існують і інші способи використовування RAID-масивів. Іноді можуть зустрічатися комбінації різних схем, наприклад, рівень RAID-10 є розшаруванням (RAID-0) в поєднанні з дзеркальним відображенням (RAID-1). Найбільш часто в дискових підсистемах файлових серверів використовуються рівні RAID-1, RAID-3 і RAID-5.
Тестувальне порівняння
Як ми вже говорили, продуктивність RAID -массива залежить від його рівня і від числа вінчестерів, що входять в масив. Порівняємо продуктивність RAID 1, RAID 0 з двома вінчестерами, RAID 0 з чотирма вінчестерами і RAID 5. Для тестування використовувалася наступна тестова конфігурація:
Процессор Intel Pentium 4 2.26 ГГц
Шина 533 МГц
Системна плата Abit BD7II-RAID
Чипсет Intel 845E
Північний міст Intel 82845E (MCH)
Південний міст Intel 82801DB (ICH4)
Драйвер чіпсета Intel 4.00.1013
Intel Application Accelerator 2.2.2
Пам'ять 512 Мб (2 DIMM модуля)
Тип пам'яті CAS 2.5 PC2700 DDR SDRAM
Відеокарта GeForce4 Ti 4200 128 Мб
Драйвер відеокарти NVIDIA Detonator 30.82
Вінчестери Maxtor 740X-6L 40GB 7200RPM ATA/133
ОС Windows XP Professional SP1
У усіх тестах використовувалася файлова система NTFS з розміром кластера 4 Кб. RAID 10 і RAID 5 використовувалися чотири вінчестери. Розглянемо продуктивність RAID масивів. (Мал 4.1)
Mb/c
t c.
Мал. 4.1 порівняння швидкості читання між RAID 10 та RAID 5
Ну що ж, перші тести показують, що не завжди чим дорожче, тим краще: 80-доларова плата початкового рівня HighPoint RocketRAID 133 виграє у дорогих контроллерів RAID. На жаль, RocketRAID 133 не підтримує RAID масиви п'ятого рівня, тому не можна припустити, як би повівся контроллер при розподілі індексів парності по вінчестерах. Теоретично, усі контроллери здатні передавати до 133 Мб/і щоб досягти цієї межі, потрібно буде встановити в RAID 0 чотири вінчестери із швидкістю читання вище 33 Мб/с.
Завантаженість процесора - дуже важливий чинник вибору контроллера і типу масиву як в сервері, так і в робочій станції. Практично усі контроллери показують однакові значення, що різняться залежно від типу масиву. Найвище завантаження процесора, як і очікувалося, проявляється в режимі RAID 5, тут майже усі ресурси 2.4 ГГц процесора Pentium 4 йдуть на роботу з дисковою підсистемою. Небагатьом менше витрачається в режимі RAID 0 з чотирма вінчестерами. Ну а RAID 1, RAID 0 з двома дисками, RAID 10 і RAID 0+1 є найбільш щадними в питанні завантаження CPU.
Рівень RAID великою мірою впливає на час завантаження, гри, ОС, чи інших значних за об'ємом даних програм. Ясна річ, що тут, на відміну від завантаження Windows XP, драйвери кожного разу не вантажаться. З RAID масивом 0+1: час завантаження пристосунків менший, порівняно з RAID 5, але і швидкість в грі так само значно менше, та це ще залежить від самого контролера RAID, адже при надто великому використанні процесора на розприділення, та зчитування данних, може значно зменшити саму продуктивність і програм і системи в цілому, тому не потрібно одразу спішити і встановлювати масиви для виграші у швидкості потрібно в більшій мірі мати відповідну систему, яка б могла забезпечити і потрібний рівень RAID, і при цьому виконувати усі маніпулювання з за стосунками не вичерпуючи усіх ресурсів!
Важко уявити сучасний сервер або робочу станцію, які не використовують RAID масив. Десь використовуються вінчестери з інтерфейсом SCSI, десь Serial ATA, а десь ATA100/133. Вибір інтерфейсу залежить, передусім, від грошової суми, на яку розраховує замовник сервера. Інтерфейс SCSI має переваги при частих зверненнях до файлової системи, тому великі сервери на великих підприємствах мають ATA100/133 вінчестер для завантаження операційної системи і SCSI RAID масив для зберігання інформації, до якої здійснюватиметься доступ клієнтів. Як правило, такі сервери мають дуже високу вартість і їх використання не завжди виправдано. Для серверів початкового рівня або для комп'ютерів, використовуваних для обробки медіа-файлів, найвигідніше використати RAID масиви з ATA100/133 вінчестерів з частотою обертання шпинделя 7200 оборотів в хвилину. З одного боку, вони мають високу швидкість передачі, порівнянну з SCSI вінчестерами, прийнятну вартість за мегабайт, та і IDE RAID контроллери коштують набагато дешевше, ніж SCSI RAID плати. При використанні чотирьох вінчестерів оптимальним є вибір RAID масиву десятого рівня, оскільки він має трохи меншу продуктивність, ніж чотири вінчестери в RAID 0, але при цьому його надійність навіть вище, ніж у RAID 1 Можна сказати, що недоліком RAID 10 є використання лише половини об'єму усіх вінчестерів в масиві, але за наявності у продажу 160-200 Гб вінчестерів, це питання можна знімати з розгляду, оскільки 400 Гб вистачить для більшості сучасних завдань. А там, де йде робота з великими об'ємами даних, зазвичай встановлюються сервери зовсім іншого рівня.
Якщо в комп'ютері встановлені лише два жорсткі диски, відведених під RAID масив. Тоді потрібно чітко розуміти, як використовуватиметься їх дисковий простір. Якщо під тимчасові файли або файл підкачування, то має сенс встановити їх в RAID 0, оскільки вартість інформації на них буде нижча, ніж вартість часу, який дозволить отримати швидший масив. Ну а якщо на цих вінчестерах зберігатиметься важлива інформація, то має сенс ставити лише
RAID 1 (зеркалювання). Оскільки надійність такого масиву буде навіть нижча, ніж надійність одного вінчестера і у разі виходу з ладу одного, відновити дані буде неможливо.
Зробимо простенькі розрахунки. Для прикладу візьмемо RAID 0 рівня, і деякі данні про кількість вінчестерів загалом, та їх вихід з певним періодом часу.
В теорії надійності більше використовується величина ймовірності безвідмовної роботи P(t). Вона характеризує ймовірність того, що в межах заданого періоду часу t не станеться відмова певного пристрою.
P(t)= [N-n(t)] / N (1)
де n(t) - кількість пристроїв, які перестали працювати за певний проміжок часу під час випробувань, N - загальна кількість пристроїв, що підлягали випробуванням.
Візьмемо для прикладу 20000 вінчестерів, сім днів їх роботи, тобто будемо визначати надійність у проміжках 2, 4, та 7 днім після запуску, за умови, що на 2й день з ладу вийшло 200, на 4й 1000 а на 7й день 2000 вінчестерів, робимо обчислення за наступними діями!
Підставляємо значення у формулу (1) і знаходимо P(t) через 2 дня. після початку випробувань.
P(2д)= (N-n(2д))/N=(20000-200)/20000 =0.99
Аналогічно шукаємо P(t) через 4 дні після початку випробувань.
P(4д)= (N-n(4д))/N=(20000-1000)/20000 =0.95
Знаючи ймовірність безвідмовної роботи протягом певних проміжків часу (наприклад для 2х днів і для 4х днів) ми можемо визначити ймовірність безвідмовної роботи пристрою за довільний проміжок часу.
P(t1,t2) = P(t2) / P(t1)
де P(t1,t2) - ймовірність безвідмовної роботи протягом певних проміжків часу.
P(t1) - ймовірність безвідмовної роботи протягом першого проміжку часу.
P(t2) - ймовірність безвідмовної роботи протягом другого проміжку часу.
P(2д,4д)=0,95/0,99=0,959
Отже, ймовірність безвідмовної роботи для заданих проміжків часу становитиме 0.959.
Робимо розрахунки і для решти проміжків і складаємо графік (Мал 4.2.)
P(7д)= (N-n(7д))/N=(20000-2000)/20000 =0.9
P(4д,7д)=0,9/0,95=0,947
Мал. 4.2 графік надійності RAID 0 протягом 7ми днів.
4. Висновки
На даний момент ми живемо у час швидкого технологічного прогресу, щороку робляться нові відкриття і дуже важливим чинником є надійність зберігання усіх цих відкриттів і багато іншого чим ми щоденно користуємось, переглядаємо, у наш час інформація коштує дорожче, ніж носій, на якому вона зберігається. Виробники вінчестерів завжди заявляють ресурс напрацювання на відмову, MTBF, що вимірюється в тисячах годин, ресурс вінчестера складає, скажемо 60 000 годин (майже 7 років безперервної роботи), але це значення - усереднене і на жаль, частенько вінчестери не виробляють і половину заявленого ресурсу. Так що при виборі RAID масиву краще вважати істиною, що усі вінчестери ненадійні і потрібно бути готовим до того, що будь-який вінчестер може вийти з ладу на другий день після установки, тому бажано організовувати зеркальні копії, щоб убезпечити себе від втрат важливої інформації, особливо на серверах, які безперервно цілодобово працюють, адже доступ до мережевих ресурсів повинен бути у любий час, 24 год. На добу, 7 днів на тиждень, тому більшість компонентів резервуються, диски об'єднуються у масиви і при виході одного чи кількох з них, сервер дальше, безперебійно продовжує працювати, та перш за все як і було описано вище, це ще залежить від типу масиву.
5. Література
1. С. Мюллер. Модернизация и ремонт ПК, Киев,2005 г.
2. А. Ватаманюк. Устранение неполадок ПК, Санкт -Петербург, 2005 г.
3. Кутузов М., Преображенський А. Вибор и модернизация комп'ютера. Анатомія ПК- СПб.: Питер 2003.-320 ст.
4. Періодичні видання (журнал “CHIP”, “Комп'ютери + программы”, “Мир связи”, “HiTech”, газета “Computer Word” та ін.
5. Фондові лекції
6. Електронні версії конспекту лекцій, методичних вказівок до лабораторних робіт.
7. В. Локазюк. Ю. Савченко. Надійність, контроль, діагностика і модернізація ПК. Київ, 2004 р.
8. Привалов А. Апгрейд компьютераю - СПб.: Питер 2003.- 289 ст.
9. Качан Б.М., Мкртумяци И.Б. Основы эксплуатации ЭВМ.-М.:Энергоатомиздат, 1988.-432 с.
10. www.easycom.ua інтернет-сайт для тестування комплектуючих ПК
11. Щелованов Л.Н. МУ к курсовому проектированию. ЛЭИС.-Л.. 1998
12. Когновицкий О.С. Основы циклических кодов. Учебное пособие. ЛЭИС.-Л.,1990
13. Емельянов Г.А. Передача дискретной информации. - М: Радио и связь, 1982.
14. Якобевский. Справочник по цифровым и аналоговым микросхемам. - М: Радио и связь, 1990.
Размещено на Allbest.ru
Подобные документы
RAID - масив з декількох дисків, керованих контролером, взаємопов'язаних швидкісними каналами. Рівні RAID масивів: переваги та недоліки. Кількість жорстких дисків в комбінованих масивах. Розподіл файлів по JBOD-масиву. Мережеві системи зберігання даних.
контрольная работа [1,6 M], добавлен 15.03.2013Понятие и назначение, основы создания RAID–массивов, принципы их работы и законы функционирования. Классификация и разновидности систем RAID, их отличительные признаки, оценка преимуществ и недостатков каждого вида. Тестовая разработка RAID-массива.
курсовая работа [1,7 M], добавлен 24.04.2010Аппаратные и программные RAID-массивы. Расчет объема массива. Временные затраты на расчет и запись контрольных сумм. Пример распределения файлов по JBOD-массиву. Вероятности отказа каждого диска в массиве. Сравнение стандартных уровней RAID-массивов.
курсовая работа [3,0 M], добавлен 28.03.2011Поняття та класифікація технологічних операцій, їх склад і зміст, порядок організації їх виконання в економічних інформаційних системах. Технологія створення і ведення інформаційних масивів. Методика обробки інформації з ціноутворення та прибутків.
реферат [34,8 K], добавлен 27.07.2009Визначення двовимірних масивів. Розміщення елементів на головній та бічній діагоналі. Алгоритми обробки двовимірних масивів. Двовимірні масиви в задачах лінійної алгебри. Ініціалізація елементів матриці за допомогою генератора псевдовипадкових чисел.
контрольная работа [162,8 K], добавлен 02.12.2014Проектирование программы объединения двух накопителей в один узел памяти для увеличения ее объёма и скорости доступа к ней. Создание RAID-массива нулевого уровня как средство повышения быстродействия дисковой подсистемы, его преимущества и недостатки.
дипломная работа [1,0 M], добавлен 29.12.2014Технологія OpenMP як найпопулярніший засіб програмування комп'ютерів із загальною пам'яттю. Типи конструкцій OpenMP: функції виконуючого середовища OpenMP, директиви pragma. Аналіз параметрів операційного середовища OpenMP, особливості типів блокувань.
реферат [397,2 K], добавлен 09.06.2012Уточнення змісту понять "технологія", "інформаційні технології" та "інформаційно-комунікаційні технології". Основні методи, методики та зміст інформаційних засобів навчання іншомовного спілкування, що використовуються педагогами вищих навчальних закладів.
статья [26,8 K], добавлен 31.08.2017Характеристика швидкодії алгоритмів сортування масивів прямим і бінарним включенням, методами "бульбашки", "камінця", та шейкерного відбору, визначення їх переваг та недоліків. Огляд функцій сортування із стандартної бібліотеки мови програмування С++.
курсовая работа [452,1 K], добавлен 16.09.2010Особливості методів сортування масивів прямим та бінарним включенням. Порівняльна характеристика швидкодії алгоритмів сортування способами включення із зменшуваними швидкостями, обміну на великих відстанях, вибору при допомозі дерева (Тree і Heap Sorts).
курсовая работа [58,9 K], добавлен 16.09.2010