Минимизация трафика в облачной инфраструктуре

Облачные вычисления как новое направление компьютерных технологий. Анализ планирования избыточного размещения данных по узлам облачной платформы для минимизации пересылки информации. Расчет объема сетевого трафика при обработке и пересылке данных.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 29.04.2017
Размер файла 193,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Минимизация трафика в облачной инфраструктуре

Суханов В.И.

Облачные вычисления (Cloud Computing) - новое направление компьютерных технологий, которое решает много организационных, юридических и финансовых проблем пользователям, но требует от провайдеров предоставление широкого спектра сервисов и технологий, покрывающих возможные запросы со стороны клиентов. Облачные технологии основаны на инфраструктуре аппаратных и программных средств, содержащих набор вычислительных машин - узлов, объединенных локальной сетью передачи данных для приватных и сетью Интернет для публичных облаков. Организуют работу таких структур провайдеры, предоставляющие клиентам вычислительные услуги. Провайдер может располагать как собственной инфраструктурой, так и арендовать ее у поставщика IaaS.

Общая схема взаимодействия платформы с арендованной инфраструктурой и приложениями при предоставлении услуг конечным пользователям приведена на рисунке 1.

Провайдер по контракту с предприятием предоставляет разработчикам его приложений и сервисов инструментарий для развертывания приложений в облаке, обеспечивая масштабирование за счет развертывания дополнительных копий приложения на виртуальных машинах облачной инфраструктуры и последующую балансировку их загрузки запросами, поступающими от пользователей.

Эффективность предоставления услуг клиенту определяется во многом объемом накладных расходов на организацию вычислений на узлах сети и пересылки данных между ними. Если быстродействие узлов легко наращивается установкой многоядерных процессоров, то скорость пересылки данных не может варьироваться в широких пределах по техническим причинам.

Как правило, скорость пересылки данных существенно ниже скорости их обработки процессором узла и пересылка данных становится узким местом. Объем сетевого трафика во многом определяет задержки в обслуживании клиентов и стоимость услуг в целом.

Рисунок 1 -- Схема взаимодействия подсистем и пользователей облачной платформы

Поэтому актуальной является задача эффективного планирования размещения клиентских приложений по узлам сети, позволяющего уменьшить накладные расходы, включая задержки на транспортировку данных и оплату сетевого трафика.

Задачи распределения ресурсов для оптимизации размещения виртуальных машин и статического распределения потока запросов к серверам в инфраструктуре облака носят нелинейный комбинаторный характер. Нелинейными, как правило, являются ограничения и критерии качества принятия решений, а комбинаторным является множество, из которого эти решения выбираются. Решением таких задач является размещение набора объектов в позициях формируемого плана.

Для задач организации вычислительного процесса в сложных сетях облачной инфраструктуры объектами являются виртуальные машины, программы, наборы данных, заявки; позициями являются узлы, устройства памяти, место в очереди на исполнение. Критерии - стоимость и качество предоставления услуг.

Комбинаторные задачи с нелинейными критериями относятся к классу NP-полных задач (Nondeterministic Polinomial) с экспоненциальной оценкой времени их решения [1]. Точное решение таких задач можно получить перебором всех допустимых распределений объектов по позициям, но затраты времени будут неприемлемы для нужд практики. Аналогичную оценку сложности имеют точные методы, основанные на методе ветвей и границ, из-за высокой сложности получения нижних (верхних) граней критерия качества, связанной с нелинейностью целевых функций и ограничений и, как следствие, возрастающим числом возвратов при выборе направления ветвления.

Математическая модель задачи планирования распределения приложений по узлам облачной инфраструктуры позволяет классифицировать сложность ее решения и наметить пути поиска инженерных методов реализации алгоритма. В нашем случае имеется n приложений, которые необходимо разместить по m узлам облака. Приложения требуют для своей работы вектор ресурсов

(1)

Содержательно потребляемыми ресурсами являются внешняя память, размещаемые на узлах нужные пакеты прикладных программ, серверов, сервисов и библиотек, интенсивность поступающих запросов и степень загрузки центральных устройств, интенсивность межмашинного взаимодействия через сетевые адаптеры и другие параметры, критичные в той или иной конфигурации технических и программных средств узла. Потребление ресурсов может измеряться количественно, например, объем внешней памяти, загрузка процессора, так и качественно, например, наличие нужного пакета.

Машины узлов располагают ресурсами в объемах

(2)

Как и для потребителей ресурсов все соглашения о их номенклатуре и предоставляемых объемах остаются в силе.

Приложения при своей работе требуют пересылки данных друг-другу в среднем в единицу времени в объемах, задаваемых матрицей

(3)

Матрица C не обязательно должна быть симметричной, что отражает возможную неравномерность пересылки данных в разных направлениях приложениями.

Для обеспечения надежности и живучести каждое приложение должно быть размещено в сети в p копиях. Определим матрицу переменных, определяющих размещение приложений в узлах сети следующим образом:

(4)

Переменная принимает значение 1, если приложение с номером i размещается в узле j, в противном случае - 0. Число элементов столбца матрицы размещения равно числу приложений, помноженному на число их копий. Для целей удобства записи номеров приложений и их копий, используемой в следующих конструкциях, нумерация строк начинается с нуля. Число столбцов равно числу узлов сети и их нумерация начинается с единицы.

Требование размещения каждой копии приложения точно на одном узле формулируется следующим условием:

(5)

Запрет размещения нескольких копий приложения на одном узле будет выглядеть так:

(6)

То есть, если какая-то копия i-го приложения размещена на узле j, то другая копия того же приложения не может быть на том же узле: произведение соответствующих индикаторов присутствия равно нулю.

Объем требуемых ресурсов приложениями, размещаемыми в узле, не должен превышать его возможностей, что формулируется следующим условием:

,(7)

где (a mod b) - остаток от a по модулю b.

Для принятого размещения X приложений объем трафика между парой узлов (u, v) будет вычисляться суммой всех пересылок данных во всех направлениях между всеми парами приложений, расположенных на этих узлах:

.(8)

Целевая функция задачи оптимального распределения приложений по узлам облака будет определяться суммой трафика между всеми парами узлов облака:

.(9)

Таким образом, имеем поиск решения (4) задачи булевского комбинаторного программирования с нелинейными ограничениями (5 - 7) и нелинейной целевой функцией (9). Это хорошо известная проблема о разрезах в графе, точное решение которой имеет сложность NP-полной задачи [1]. Для получения решения в обозримое время с достаточной инженерной точностью приходится прибегать к эвристическим алгоритмам, не гарантирующим контролируемую погрешность.

Первая проблема - наличие и поиск допустимых решений, удовлетворяющих ограничениям (5 - 7). В реальных условиях коммерческих услуг со стороны провайдера инфраструктуры облака обычно имеется достаточный запас критических ресурсов, определяющих самое важное ограничение задачи, задаваемое системой неравенств (7). Остальные ограничения являются техническими и выполнимы всегда. В этих условиях проблема наличия и поиска допустимых решений не составляет труда.

Допустимый план X может удовлетворять кроме ресурсных еще ряду условий:

декларациям, определяющим обязательные закрепления приложений;

рекомендациям по диапазонам допустимых для приложений узлов;

несовместимости приложений друг с другом.

Поиск допустимого решения будем вести последовательно. Начальным состоянием процесса построения решения является частичный план X0, учитывающий декларативные закрепления. Допустимые планы задачи образуют множество R конечных состояний процесса построения решения.

Для элементов определим расстояние от границы множества R:

Центрами в R будут планы Xo, для которых . Планы центра Xo обладают максимальным запасом устойчивости при изменении внешней обстановки при их реализации. Для сравнительной оценки состояния ресурсов целесообразно перейти к нормированной величине потребления ресурсов позициями:

.

Шагом процесса будет закрепление одного объекта в некоторой позиции плана. Выбор на шаге s переводит процесс из состояния xs в состояние . Состояние x' достижимо из x (x x'), если существует последовательность шагов , переводящая x в x'. Множество состояний Rg достижимое из Rf (Rf Rg), если из каждого состояния достижимо некоторое .

Пусть - множество допустимых планов, достижимых из позиции . Оценка

характеризует близость множества к центру Xo совокупности R. Экстремальным переходом из позиции xs будем называть выбор из условия

.

Глубиной рефлексии r алгоритма поиска решения будем называть число подмножеств , просматриваемых на каждом шаге s. Каждое может быть представлено разбиением

.

Таким образом, каждое подмножество содержит состояния, из которых можно построить допустимый план. Оценка свойства непустоты Rs+r может быть произведена с ростом r с большей точностью. Ввиду ограниченных вычислительных возможностей ЛПР фиксирует величину r, например, полагая r = 1.

Рассмотрим случай (для больших значений r полученные результаты распространяются индуктивно), когда ЛПР затрачивает минимальное время на решение задачи. При этом он располагает знаниями на один шаг процесса: текущее состояние xs, возможные управления и множество достижимых состояний. Для всех xs+1 зададим нечеткую функцию , определяющую степень принадлежности xs+1 целевому множеству R's+i. Воспользуемся эвристической гипотезой: величина является неубывающей функцией от размера запаса ресурсов. Следовательно, максимизация запасов на шаге s способствует достижению целевого множества R. Свойства объектов и позиций определяют различную зависимость между распределяемыми ресурсами. В связи с этим рассмотрим следующие ситуации.

Построение начального допустимого плана может требовать значительного трудно прогнозируемого времени при больших значениях глубины рефлексии. Здесь сказывается экспоненциальный рост числа просматриваемых вершин дерева решений. Поэтому в инженерной практике целесообразно ориентироваться на алгоритмы с контролируемым временем работы. Таким алгоритмом может быть последовательное улучшение плана [2, 3] за счет перестановки приложений в узлах.

Выберем произвольным способом некоторое подмножество приложений небольшой мощности, например, . При небольшом числе объектов в E можно перебором найти их наилучшее расположение по узлам сети, не затрагивая позиций остальных приложений. Число проб в этом случае не превышает , что вполне приемлемо для современных ЭВМ. Поиск их нового размещения следует выполнять с учетом ограничений (5 - 7) задачи. Если новое размещение улучшает старое, то заменяем им старое и продолжаем попытки улучшить план. Если все попытки не приводят к улучшению, то заканчиваем поиск решения основной задачи. облачный компьютерный информация трафик

При отборе групп объектов следует учитывать мощность E, существенно влияющую на объем проделываемой работы. Во-первых, с увеличением числа объектов увеличиваются затраты времени алгоритма, часто нелинейно, как полином высокой степени. Во-вторых, число попыток растет как число сочетаний , где n - общее число объектов; h = |E | - мощность группы. Поэтому часто из соображений экономии времени ограничиваются величиной h = 2.

Описанный подход удобен тем, что позволяет остановить процесс улучшения в любой момент по истечению отпущенного бюджета времени на поиск решения. В силу экспоненциальной сложности общей задачи (3 - 9) полный процесс может продолжаться трудно обозримое время, существенно зависящее от размерности задачи, задаваемой константами n, m, p, h.

Последнее замечание. Получаемый в результате последовательного процесса неулучшаемый план существенно зависит от начального допустимого плана. Описанный процесс аналогичен известным методам управляемого спуска, в частности, градиентному. Результатом такого процесса является попадание в локальный минимум целевой функции. Если у ЛПР есть достаточный ресурс времени, то целесообразно повторять процесс поиска для различных начальных планов, выбрав из всех локальных решений наилучшее.

Размещено на Allbest.ru


Подобные документы

  • Анализ модели политики безопасности. Программы сетевого общения (Instant Messengers и чаты). Удаление информации без возможности восстановления. Устройства хранения, файловые системы, уязвимости. Пример защиты ПК методом фильтрации сетевого трафика.

    курсовая работа [97,2 K], добавлен 17.12.2015

  • Обзор области генерации сетевого трафика. Описание выбранных методов, моделей, алгоритмов решения задач. Создание модели поведения пользователя, распределение количества посещённых страниц сайта. Выбор средств реализации программного продукта (проекта).

    курсовая работа [1,3 M], добавлен 30.06.2017

  • Способ моделирования сетевого трафика случайным точечным процессом. Ступени разработки моделей процессов в сети. Определение статистик числа отсчетов на интервалах. Принятое в теории фрактальных процессов обозначение интенсивности точечного процесса.

    контрольная работа [5,6 M], добавлен 14.12.2015

  • Современные подходы к организации транспортных сетей, принцип передачи потока данных, технология и механизм работы VPLS. Сравнительный анализ туннелей MPLS и обычных туннелей VPN. Анализ распределения трафика на основе методов трафика инжиниринга.

    курсовая работа [1,0 M], добавлен 12.11.2011

  • Исследование основ метода движения трафика в сети. Ознакомление с IP адресацией и IP пакетами, протоколами. Определение понятия и функций сокета. Создание программного приложения мониторинга трафика (поступления и отправки пакетов между абонентами).

    курсовая работа [474,7 K], добавлен 20.04.2015

  • Модели развертывания и облачные модели. Анализ существующих методов информационной безопасности. Обеспечение надежного шифрования данных при передаче их от пользователя к провайдеру услуг по хранению данных. Минимизация нагрузки на облачные сервисы.

    дипломная работа [839,1 K], добавлен 17.09.2013

  • Создание и проверка модели оптимального размещения файлов в вычислительной сети со звездообразной, кольцевой и произвольной топологией. Объем данных, необходимый для пересылки файлов. Оптимальное распределение файлов по узлам вычислительной сети.

    контрольная работа [56,7 K], добавлен 20.05.2011

  • Системы автоматизированной обработки информации. Хранение большого объема информации. Понятие базы данных (БД). Обеспечение секретности данных. Уровни представления данных в БД. Логическая структура данных. Ограничения, накладываемые на данные.

    реферат [65,2 K], добавлен 26.11.2011

  • Разработка методов сбора информации о событиях в ИТ-инфраструктуре. Анализ структуры единичного события. Извлечение данных из сообщений о событиях, выявление причинно-следственных связей между ними. Архитектура централизованного журналирования событий.

    дипломная работа [2,6 M], добавлен 19.09.2016

  • Проблемы, связанные с продуктивным распределением и систематизированием больших потоков информации. Основные виды распределенных баз данных, анализ процессов их функционирования. Стратегии распределения данных. Распределение сетевого справочника данных.

    курсовая работа [397,5 K], добавлен 09.08.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.