Сравнительный анализ GLOBUS и X-Com
Анализ данных посредством интеграции глобально распределенных процессорных мощностей и систем хранения данных. Набор инструментальных средств для разработки приложений Globus. Локальное управление ресурсами и заданиями. Основные виды сервисов в Globus.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | шпаргалка |
Язык | русский |
Дата добавления | 28.06.2009 |
Размер файла | 22,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
- Сравнительный АНАЛИЗ GLOBUS и X-Com
- Содержание
- Введение
- 1. Архитектура сети
- 2. Планирование вычислений
- 3. Прикладные задачи
- Резюме
Введение
В данном параграфе мы сравниваем характеристики набора инструментальных средств Globus, на примере его использования в европейском проекте EU Data Grid.
Проект EU Data Grid (http://www.eu-datagrid.org) нацелен на решение задач физики высоких энергий, биоинформатики и системы наблюдений за землей. Общим во всех исследованиях является разделение по различным базам данных, распределенным по всем континентам.
Основная цель проекта - улучшение эффективности и скорости анализа данных посредством интеграции глобально распределенных процессорных мощностей и систем хранения данных, доступ к которым будет характеризоваться динамическим распределением по Grid-инфраструктуре, что предполагает управление репликацией и кэшированием.
Globus скорее представляет собой набора инструментальных средств для разработки распределенных приложений, чем замкнутый комплект утилит для пользователей.
К основным видам сервисов, включенных в Globus относят следующие:
- Связь. Собственный стек протоколов, который функционирует параллельно с TCP/IP.
- Информационное обслуживание. Globus включает в себя мощные средства управления распределенной инфраструктурой (базы данных ресурсов)
- Безопасность. Безопасность в Globus является многоаспектной проблемой, включающий вопросы аутентификации, авторизации, разграничения прав и т.д.
- Управление ресурсами. Специальные средства заказа ресурсов и планирования вычислений.
- Локальное управление ресурсами и заданиями.
Для сравнение Globus и X-Com мы решили остановиться на следующих критериях:
1. Архитектура сети
1.1. Узлы сети
1.2. Коммуникационная сеть
1.3. Логическая архитектура сети
1.4. Безопасность
2. Планирование вычислений
2.1. Способ планирования вычислений
2.2. Управление инфраструктурой
3. Прикладные задачи
3.1. Средства разработки
3.2. Прикладные задачи
1. Архитектура сети
Узлы сети |
||
EUGrid/Globus |
X-Com |
|
Гетерогенная сеть, состоящая из разнородных узлов: вычислительных узлов (супер-ЭВМ, кластеров серверов, рабочих станций и т.д.), хранилищ данных, устройств визуализации и специальных устройств. Мощные средства распределенного планирования позволяют учитывать динамическое вхождение и исключение из системы ресурсов сети, но не ориентированны на динамически изменяемую мощность каждого узла, что не позволит в полной мере использовать уже существующие мощности. |
Однородная сеть, узлами которой являются только вычислительные узлы (нет хранилищ данных и т.д.), что не исключает выполнение узлами разных задач. Мощность узлов никак не лимитируется архитектурой сети, система динамически и автоматически определяет фактическую мощность узлов и использует эту информацию для планирования. |
|
Таким образом, система Grid/Globus предназначена для большего количества задач, например, при наличии большого объема данных их можно распределить по узлам сети, но включение в систему новых узлов усложняется. |
||
Коммуникационная сеть |
||
EUGrid/Globus |
X-Com |
|
Строится собственная сеть с собственными протоколами передачи данных. Сеть строится ярусами. Ярусы начальных уровней (до третьего) сильно связаны высокоскоростными каналами передачи данных (порядка 100Gbit/sec), что влечет за собой прокладку специальных линий. Ярусы конечных уровней так же требуют высокой связанности. Используются зависимые от приложения протоколы передачи данных. Включение новых узлов требует значительной программно-аппаратной работы, кроме того, сеть не может работать в асинхронном режиме, когда в некоторые моменты времени может отсутствовать связь между узлами. |
Сеть строится на стандартных протоколах передачи данных, используются HTTP, FTP, SMTP. Инфраструктура для передачи данных уже построена, и проект может задействовать практически любой существующий вычислительный ресурс. Значительно упрощается развертывание и администрирование системы, так как достаточно стандартных пользовательских прав на узлах сети. Важным аспектом является возможность работы в асинхронном режиме, когда нет постоянного сетевого соединения с вычислителем, это позволит охватить большую часть существующих вычислителей. |
|
Логическая архитектура сети |
||
EUGrid/Globus |
X-Com |
|
Логически сеть представляет собой матрицу. Где по одному измерению идут ресурсы, а по другому - проекты. Архитектура децентрализована и ориентирована на групповую разработку и эксплуатацию приложений. Группы работают с некоторым виртуальным ресурсом, который планируется и разделяется между реальными вычислителями. Заметим, что реальная сеть должна строиться исходя из специфики задачи, так решая задачи совместной распределенной обработки больших объемов данных, надо быть готовым к большому объему пересылок данных между узлами, что в свою очередь повлечет за собой организацию адекватных задаче каналов взаимодействия. |
Сеть представляет собой иерархическую систему, где есть основной сервер управляющий всеми задачами, он распределяет задачи между узлами. Сеть позволяет вводить иерархию, когда основной сервер раздает задачи логическим узлам (работа с ними строится по тому же принципу, что и с обычными узлами, просто их мощность потенциально больше, за счет чего можно планировать задачи), а те в свою очередь работают с такими же логическими узлами, или конечными вычислителями. Такая организация позволяет построить гибкую и легко наращиваемую сеть, которая сможет динамически адаптироваться к изменяющимся вычислительным особенностям узлов и при достаточно большом количестве узлов гарантировать общую вычислительную мощь сети. |
|
Безопасность |
||
EUGrid/Globus |
X-Com |
|
В данном проекте безопасности уделяется большое значение, глубоко проработаны административные и технические вопросы защиты, в том числе: - Защита от несанкционированного доступа к ресурсам сети; - Защита от умышленного взлома с целью получения доступа к данным; - Защита от умышленного взлома, приводящего к отказу сервисов; - Разграничение прав доступа к системе; Однако ряд вопросов по безопасности в данном проекте не регламентируется, например защита от умышленного искажения в одном из сегментов сети результатов расчетов |
Мы также уделяем большое внимание безопасности, но основной акцент делаем на корректности и проверке результатов расчетов (в Globus данный вопрос никак не регламентируется). В системе предусмотрена защита от всех основные видов атак: защита от НСД, защита от взлома, есть разграничение прав доступа, но в целом уровень безопасности в нашей системе ниже, чем в EU, это связанно в первую очередь с использованием стандартных протоколов Интернет (TCP/IP, HTTP, SSL). Также наша система менее устойчива к атакам направленным на отказ сервиса. Однако, гибкая архитектура X-Com позволяет продолжать эксперимент даже в случае частичного отказа некоторых сегментов сети при этом мы гарантируем правильность расчета. |
2. Планирование вычислений
Способ планирования вычислений |
||
EUGrid/Globus |
X-Com |
|
Отдельная система планирования, управление которой также требует огромных усилий. По сути, задача планирования вычислений в такой системе сама является достаточно сложной и требует разработки специальных алгоритмов. Система планирования является ориентированной на конкретные задачи и не учитывает динамически изменяющейся архитектуры сети (т.е. невозможно подключить к эксперименту узлы, которые до его начала не были запланированы для эксперимента). |
Планирование осуществляется полностью автоматически. Есть несколько готовых схем планирования, которые охватывают практически все задачи решаемого класса. Важно, что система автоматически адаптируется к существующей структуре сети и производит динамическое планирование вычислений (мы имели ввиду, что по ходу выполнения эксперимента можно в произвольный момент времени подключать и отключать узлы). |
|
Управление инфраструктурой |
||
EUGrid/Globus |
X-Com |
|
Отдельная система планирования, управление которой также требует огромных усилий. По сути, задача планирования вычислений в такой системе сама является достаточно сложной и требует разработки специальных алгоритмов. Система планирования является ориентированной на конкретные задачи и не учитывает динамически изменяющейся архитектуры сети (т.е. невозможно подключить к эксперименту узлы, которые до его начала не были запланированы для эксперимента). |
Планирование осуществляется полностью автоматически. Есть несколько готовых схем планирования, которые охватывают практически все задачи решаемого класса. Важно, что система автоматически адаптируется к существующей структуре сети и производит динамическое планирование вычислений. |
3. Прикладные задачи
3.1. Средства разработки |
||
EUGrid/Globus |
X-Com |
|
Сложный программно-аппаратный комплекс средств разработки. Практически под каждую задачу надо проводить полный комплекс разработки с учетом специфики задачи. Требует вовлечения инструментария разработки распределенных приложений, специальных средств программирования, средств хранения данных, политики поддержки групп разработки. Используются самые различные средства программирования: Java, C, Fortran. Основная проблема в том, что вычисления требуют серьезной переработки архитектуры прикладной программы. Все существующие подсистемы (Particle Physics Data Grid, China Clipper, MONARC, Nile, Condor, GIOD и др.), по сути, являются отдельными проектами, каждый из которых стоит миллионы долларов. |
Система предназначена для решения ограниченного круга, но если задача принадлежит данному классу (см. 2.2), то требуется минимальная переработка существующего кода. Приложение может быть написано на любом переносимом языке, важно чтобы этот язык имел возможность динамической линковки в операционных системах узлов. Интерфейс взаимодействия прикладной программы с основной системой четко специфицирован и не требует больших усилий для модификации существующих алгоритмов. |
|
3.2. Прикладные задачи |
||
EUGrid/Globus |
X-Com |
|
Предназначена для решения широкого круга научных задач, однако, каждая задача требует отдельной разработки и по сути мы решаем задачу распределенных вычислений в каждом конкретном случае. Система имеет хороший специальный инструментарий для этого, но разработки прикладных приложений требует больше сил. |
Предназначена для решения определенного круга задач.Основное требование, чтобы задача позволяла разбиение на небольшие блоки фиксированного количества типов, которые бы были достаточно маленькими (несколько часов вычислений на обычной рабочей станции), это необходимо, чтобы позволять динамическое планирование. Другое пожелание - небольшой объем исходных данных и результата. Таким образом, система ориентированна на распределенную обработку, небольших объемов данных. |
Резюме
EUGrid/Globus |
X-Com |
|
Ориентирована на решение более широкого круга профессиональных задач, но по сути представляет собой инструментарий к написанию решения под каждую конкретную задачу. Система Globus также ориентирована на использование уже существующие вычислительных мощностей, но потребует создания специальной инфраструктуры, затраты тут исчисляются сотнями миллионов долларов. Децентрализованное управление позволит решать различные задачи, различных групп на единой основе, но это требует массивного механизма планирования, который также привносит дополнительные финансовые и вычислительные затраты. Развертывание системы требует значительных административных и технических ресурсов, так как затрагивает архитектуру сети. |
Обеспечивает достаточную гибкость в выборе средств вычислений, по максимуму ориентированна на существующую инфраструктуру сети, но решает задачи определенного класса. Стоимость решения на основе нашей системы является минимальной, так как задействуются уже существующие, но не используемые мощности и не требуется создания специально инфраструктуры. Кроме того, центральное управление обеспечивает высокую настраиваемость и динамическую адаптивность системы. Развертывание и настройка системы предельно простые и быстрые (не требуют административных прав, а также специальных настроек сетевых сервисов). |
Подобные документы
Характеристики распределенных систем баз данных, формируемые путем "интеграции" разнородных аппаратных и программных средств. Концепция дифференциального файла для различных приложений. Сравнение разных технологий файлового сервера и "клиент-сервера".
курсовая работа [411,9 K], добавлен 28.05.2015Определение, свойства и характеристики распределенных систем баз данных. Основная задача систем управления ими. Архитектура распределения СУБД. Сравнение технологий файлового сервера и "клиент-сервера". Стратегия распределения данных по узлам сети ЭВМ.
курсовая работа [601,3 K], добавлен 24.05.2015Определение базы данных и банков данных. Компоненты банка данных. Основные требования к технологии интегрированного хранения и обработки данных. Система управления и модели организации доступа к базам данных. Разработка приложений и администрирование.
презентация [17,1 K], добавлен 19.08.2013Проблемы, связанные с продуктивным распределением и систематизированием больших потоков информации. Основные виды распределенных баз данных, анализ процессов их функционирования. Стратегии распределения данных. Распределение сетевого справочника данных.
курсовая работа [397,5 K], добавлен 09.08.2015Принципы и критерии построения распределенных баз данных. Ряд свойств, которым по К. Дейту должна удовлетворять распределенная база данных: независимость узлов, прозрачность расположения, обработка распределенных запросов. Типы распределенных баз данных.
реферат [131,5 K], добавлен 18.06.2013Организация хранения мультимедийных данных, основные виды систем управления базами данных и их характеристика. Магнитные и оптические запоминающие устройства. Файловые системы для оптических носителей. Иерархическое управление запоминающими устройствами.
презентация [93,4 K], добавлен 11.10.2013Тенденция развития систем управления базами данных. Иерархические и сетевые модели СУБД. Основные требования к распределенной базе данных. Обработка распределенных запросов, межоперабельность. Технология тиражирования данных и многозвенная архитектура.
реферат [118,3 K], добавлен 29.11.2010Администрирование баз данных. Проектирование баз данных, язык запросов к базе данных. Анализ средств разработки приложений. Планирование разработки программы "Электронный каталог" для библиотеки ОГАУ, предварительный проект и практическая реализация.
дипломная работа [1,2 M], добавлен 02.06.2015Характеристика категорий современных баз данных. Исследование особенностей централизованных и распределенных баз данных. Классификация систем управления базами данных по видам программ и применению. Управление буферами оперативной памяти и транзакциями.
курсовая работа [45,2 K], добавлен 10.03.2016Проектирование логической структуры базы данных методом нормальных форм, сущность связь. Сравнительный анализ спроектированной базы данных и базы данных существующих информационных систем. Выбор и обоснование состава технических и программных средств.
курсовая работа [3,0 M], добавлен 22.12.2014