Отказоустойчивые вычислительные системы

Знакомство с преимуществами отказоустойчивых вычислительных систем: безотказность, бесперебойность. Анализ примеров систем с различными значениями вероятностей безотказной работы. Общая характеристика способов и методов построения отказоустойчивых систем.

Рубрика Программирование, компьютеры и кибернетика
Вид доклад
Язык русский
Дата добавления 23.04.2013
Размер файла 61,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Отказоустойчивые вычислительные системы

отказоустойчивый вычислительный безотказность

Отказоустойчивой вычислительной системой называют среду, которая предоставляет постоянное, непрерывное обслуживание - доступ к данным и приложениям - даже в случае возникновения сбоев в аппаратных, программных или сетевых компонентах.

Отказоустойчивые IT-системы

Стремление к повышению функциональности устройств значительно опережает темпы развития и усовершенствования существующих методов повышения надежности. В такой ситуации единственным эффективным средством защиты от сбоев в работе является построение отказоустойчивых систем. На что они способны?

Сегодня спрос на широкую функциональность ИТ-систем уходит на второй план, уступая место требованиям максимальной надежности. Особенно актуально это для бизнеса, где ошибка в работе системы или временной ее простой (составляющий порой секунды) оборачиваются более чем внушительными финансовыми потерями. Особенно сильно от такого рода аварий страдает финансовая индустрия, час неработоспособного простоя которой может исчисляться несколькими миллионами долларов убытка.

Таблица. Финансовые потери по вине отключения электричества

Индустрия

Операция

Средняя стоимость часа простоя, $

Финансы

Маклерские операции

6,5 млн.

Финансы

Авторизация кредитных карт

2,6 млн.

Средства массовой информации

Платное телевидение

1,1 млн.

Торговля

Покупка из дома (ТВ)

113 тыс.

Транспорт

Резервирование билетов

89,5 тыс.

Ядерная энергетика, военная и авиационная промышленность представляют собой наивысшую потенциальную угрозу человеческой жизни и окружающей среде, и по этой причине особенно нуждаются в наличии максимально надежных и безотказных систем, исключающих в работе сбои по вине человеческого фактора. Такие решения не только возможны, но и уже активно используются.

Отказы бывают разные

При разработке и последующей эксплуатации систем с повышенным значением надежности необходимо наличие решений, повышающих вероятность того, что система в момент времени t будет находиться в работоспособном состоянии. Такая вероятность называется доступностью системы.

При выборе и последующей эксплуатации систем на рынке телекоммуникаций и связи, в первую очередь, необходимы: безотказность (свойство системы на протяжении определенного времени работать без отказов) и высокая ремонтопригодность (готовность к работе после возникновения неисправности, которая определяет степень сложности исправления дефекта неисправности/ошибки в системе).

Во многих компания цена построения и внедрения отказоустойчивой/высоконадежной системы может легко соизмеряться с потерями от нескольких часов простоя, или даже минутой бездействия по вине отказа. Например, в телекоммуникационной корпорации AT&T впервые была установлена система высокой надежности (1ESS, Electronic Switching Systems), гарантирующая на момент внедрения системы не более двух часов простоя на протяжении 40-ей эксплуатации (составляет примерно 3 минуты простоя в год). Отказ в 1990 году 4-ого поколении ESS системы (4ESS), послуживший причиной 9 часов простоя 114 телекоммуникационных систем, принес ущерб AT&T в 90 млн. долларов. В тот же день ошибка была найдена и со слов директора отделах технологий Larry Seese корпорации, причиной лавинного отказа 4ESS послужила ошибка в программном обеспечении системы.

Технические решения на транспорте, в авиационной/военной промышленности уделяют первостепенное значение важности построения безопасных систем (систем, исключающих опасный отказ). Это достигается тем, что в перечисленных отраслях, а так же и в областях автоматизации технологических процессов ядерной энергетики, используются высоконадежные безопасные системы с высокими степенями защиты от многочисленных факторов. Эти сложные системы автоматизации, сигнализации, контроля разрабатываются с учетом, так называемого свойства защищенности от воздействия помех, которые могут привести к ложному действию или незапланируемому срабатыванию системы. Иными словами, такие высоконадежные безопасные схемы можно встретить там, где речь идет о сбоях, влекущих за собой, катастрофические последствия.

Примером опасного отказа может послужить ложное включение разрешающего сигнала светофора при необходимом запрещающем. Свойство защищенности системы от воздействия помех обычно обеспечивается конструктивными и рабочими параметрами внутренних компонентов системы на элементном уровне, а так же на системном уровне, в частности, на уровне алгоритмов функционирования и взаимодействия.

Элегантным примером следующей характеристики, ремонтопригодности системы, может послужить модульный принцип построения промышленных компьютеров, при котором вышедшие из строя модули, заменяются исправными, без воздействия на другие компоненты.

Разработка отказоустойчивой системы (fault-tolerant system) или отказоустойчивая эксплуатация последней, должны основываться на знании и понимании природы тех видов отказов, вероятность которых, при данных условиях эксплуатации устройства, имеют максимально большую вероятность возникновения.

По времени воздействия на объект отказы подразделяются на постоянные (permanent fault - однократное воздействие без возможности последующего использования системы), перемежающиеся отказы (intermittent fault - многократное повторение ситуации без взможности определения ее закономерности) и проходные отказы (transient fault - однократный кратковременный отказ без возможности его повторения при рестарте системы).

Важно понять, что отказы могут возникать внезапно (без предварительного ухудшения выходных характеристик), либо заранее прогнозироваться постепенным изменением выходных характеристик. Поэтому для оценки отказоустойчивости новой системы и ее надежности, важен регулярный анализ статистической информации и как следствие анализа, стремление уменьшить влияние определенных неблагоприятных воздействий.

Методы построения отказоустойчивых систем

На сегодняшний день не существует системы, гарантирующей 100% отказоустойчивость. Другими словами, не существует системы, которая гарантирует 100% вероятность безотказной работы на протяжении задаваемого промежутка времени (100% доступность).

Таблица. Примеры систем с различными значениями вероятностей безотказной работы

Вероятность безотказной работы, %

Время простоя/год

Пример

99

5000 минут

web страница общего характера

99,9

500 минут

Amazon.com

99,99

50 минут

Почтовый сервер крупного предприятия

99,999

5 минут

Телефонная система

99,9999

30 секунд

Высокоскоростной телефонный коммут.

Существует два основных направления при построении отказоустойчивых систем. Первый способ - использование только отказоустойчивых компонентов. При реализации этого направления каждый компонент системы может продолжать свое функционирование, даже если один/несколько подкомпонентов системы, выходят из строя. Второй способ разработка методов, гарантирующих построение отказоустойчивой системы из компонентов, не являющихся отказоустойчивыми. В таких системах отказоустойчивость реализована за счет введения избыточности и разработки специального программного обеспечения, элементных взаимосвязей и алгоритмов функционирования.

Схема. Способы построения отказоустойчивых систем

Внесение отказоустойчивости в систему или отдельно взятый компонент всегда нуждается в появлении некоторой избыточности. Избыточность - это наличие в структуре устройства возможностей сверх тех, которые могли бы обеспечить его нормальное функционирование. Избыточность вводится для повышения надёжности работы и для исключения влияния на достоверность передаваемой информации помех и сбоев (в телекоммуникационных устройствах). В основном используется четыре вида избыточности.

Аппаратная избыточность (Hardware Redundancy, более известна как резервирование). Существуют методы постоянного резервирования (синтез избыточных устройств, нечувствительных к определенному количеству ошибок) и методы резервирования замещением (использование системы контроля, которая может действовать непрерывно или периодически, в этом случае говорят, о так называемом функциональном диагностировании). Исключая даже кратковременный простой, постоянное резервирование имеет относительное преимущество по сравнению со второй группой методов, системы при отказах.

Программная избыточность (Software Redundancy) используется для контроля и обеспечения достоверности наиболее важных решений по управлению и обработке информации. Она заключается в сопоставлении результатов обработки одинаковых исходных данных разными программами и исключении искажения результатов, обусловленных различными аномалиями.

Информационная избыточность (Information Redundancy) наиболее присуща телекоммуникационным системам, в которых информация передается многократно. Информационная избыточность заключается в дублировании накопленных исходных и промежуточных данных.

Временная избыточность (Time Redundancy) заключается в использовании некоторой части производительности компьютера для контроля за исполнением программ и восстановления (рестарта) вычислительного процесса (запас времени для повторного выполнения операции (например, двойного или тройного просчёта на вычислительной машине).

Наглядным примером введения многоуровневой избыточности в систему, для достижения отказоустойчивости, может послужить система контроля и управления авиалайнера Airbus 320 (fly-by-wire flight control system). В процессе функционирования системы управления, и обеспечения взаимосвязей между различными компонентами и контроля за последними, в Airbus 320 задействовано 5 различных независимых компьютеров. Система управления авиалайнером строилась из расчета, что обнаружение ошибок должно осуществляться как в аппаратной, так и в программной части системы. По этой причине, в процессе управления полетом, дополнительно задействовано два типа программного обеспечения, от двух независимых разработчиков.

Достаточно распространены методы, когда с целью повышения надежности, система снабжается схемой внутреннего контроля (СВК/тестер), предназначение которой заключается в инициализации «сигнала отказа» при наличии неисправностей или изменения функциональности, и как следствие, несоответствие выходных сигналов. В этом случае, сигнал о ошибке используется для отключения неисправного устройства от объекта управления. Также этот сигнал может быть параллельно использован для активизации команды подключения резервного или дублирующего устройства. Но важно при этом не забыть про проверку исправности схемы самого СВК.

Отличительными преимуществами отказоустойчивых систем являются: их высокая безотказность, бесперебойность работы системы при наличии отказов и более продолжительный жизненный цикл эксплуатации. Отказоустойчивые системы помимо преимуществ имеют и ряд специфических характеристик, а именно: сложность дизайна и высокая стоимость развертывания, повышение энергопотребления, усложнение системы.

Размещено на Allbest.ru


Подобные документы

  • Структуры вычислительных машин и систем. Фон-неймановская архитектура, перспективные направления исследований. Аналоговые вычислительные машины: наличие и функциональные возможности программного обеспечения. Совокупность свойств систем для пользователя.

    курсовая работа [797,5 K], добавлен 05.11.2011

  • Характеристика электрических систем в установившихся режимах. Классификация кибернетических систем. Развитие методов моделирования сложных систем и оптимизация на электронных вычислительных машинах моделей в алгоритмическом и программном аспекте.

    реферат [27,3 K], добавлен 18.01.2015

  • Центр обеспечения безопасности (Windows Security Center) в операционной системе Windows XP SP2 и угрозы компьютерной безопасности. Обеспечение безопасности хранения данных в ОС Microsoft. Алгоритм создания отказоустойчивых томов для хранения данных.

    курсовая работа [507,1 K], добавлен 13.11.2011

  • Классификация Флинна как наиболее ранняя и известная классификация архитектур вычислительных систем, ее структура и содержание, признаки. Общая характеристика используемых классов. Описание и значение других распространенных методов классификации.

    лекция [173,1 K], добавлен 22.10.2014

  • Классификации архитектур вычислительных систем. Организация компьютерных систем. Устройство центрального процессора. Принципы разработки современных компьютеров. Эволюция микропроцессорных систем. Увеличение числа и состава функциональных устройств.

    дипломная работа [1,4 M], добавлен 29.01.2009

  • Однопроцессорные вычислительные системы не справляются с решением военно-прикладных задач в реальном времени, поэтому для повышения производительности вычислительных систем военного назначения используются многопроцессорные вычислительные системы (МВС).

    реферат [70,1 K], добавлен 30.05.2008

  • Составляющие информационных систем: определение, соотношение, изменчивость, выбор подхода к проектированию. Принципы построения корпоративных систем. Обзор технических решений для построения локальных вычислительных систем. Схемы информационных потоков.

    курсовая работа [571,6 K], добавлен 16.10.2012

  • Вычислительные системы и программное обеспечение как важнейшие разделы информатики, условия перехода общества в информационную стадию развития. Развитие вычислительных систем и персональных компьютеров. Операционные системы и системы программирования.

    реферат [906,9 K], добавлен 18.01.2011

  • Параллельные вычислительные системы, их общая характеристика и функциональные особенности, оценка возможностей, внутренняя структура и взаимосвязь элементов, типы: одно- и многопроцессорные. Параллельная форма алгоритма, его представление и реализация.

    контрольная работа [118,1 K], добавлен 02.06.2014

  • Общая характеристика преимуществ взаимодействующих процессов: модульность, ускорение вычислений. Знакомство с основами современных операционных систем. Анализ особенностей использования общего почтового ящика, рассмотрение способов создания и удаления.

    презентация [1,6 M], добавлен 24.01.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.