Открытое информационное пространство студенческого научного общества на платформе облачных вычислений

Сущность облачных вычислений, основные направления развития, их достоинства и недостатки. Сеть Интернет как платформа научных коммуникаций. Онтологии предметных областей. Анализ пользовательских ролей. Разработка портала студенческого научного общества.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 18.10.2013
Размер файла 80,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«КУБАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

(ФГБОУ ВПО «КубГУ»)

Кафедра общего, стратегического, информационного менеджмента и бизнес - процессов

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА

ОТКРЫТОЕ ИНФОРМАЦИОННОЕ ПРОСТРАНСТВО СТУДЕНЧЕСКОГО НАУЧНОГО ОБЩЕСТВА НА ПЛАТФОРМЕ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ

Специальность 080801.65 Прикладная информатика

Студент (ка) Данилов Михаил Венерович

Научный руководитель

Канд.техн. наук М.Р. Закарян Савченко

Нормоконтролер, преподаватель

Р.М. Закарян

Краснодар 2013г.

РЕФЕРАТ

Выпускная квалификационная работа 79 с., 0 рис., 0 табл., 46 источников, 0 прил.

Объектом исследования выступают научные коммуникаций студентов и аспирантов Кубанского государственного университета и факультета Управления и психологии.

Предметом исследования является процесс научных исследований и система научных коммуникаций в информационном пространстве.

Цель работы - разработка базы студенческого научного общества факультета управления и психологии КубГУ

В результате исследования была разработана база студенческого научного общества КубГУ

Степень внедрения - проект принят базой практики. Акт № 7 от «07» мая 2012 г.

Эффективность экспериментального исследования определяется актуальностью проблемы перехода установления научных коммуникаций студентов и аспирантов факультета управления и психологии

ВВЕДЕНИЕ

Развитие цифровых технологий и компьютерных сетей позволяет качественно изменить традиционные средства научных коммуникаций, реализовать новые технологии информационного взаимодействия в электронной среде. Цифровое представление информации открывает широчайшие возможности фиксации, обработки, передачи и хранения данных; обеспечивает многообразие их визуализации, интеллектуализацию обработки и компактность хранения, предоставляет широкий набор инструментальных средств для дистанционного доступа к информации и для ее передачи.

Особенность подобного средства научной коммуникации заключается прежде всего в способах подачи материала (обусловленных возможностями Интернета) и эстетических возможностях Интернет-дизайна. Важной составляющей является оперативность подачи материала и его регулярная обновляемость. В данном случае наряду с деперсонифицированными формами общения (распространение научных материалов и публикация статей в режиме он-лайн) присутствуют и формы личного и персонифицированного общения (ученый - ученый, ученый - студент, студент - студент), возможности для которого значительно возрастают, однако определяющим для установления контакта, для коммуникации мотивом является качество и тематическая направленность предлагаемого продукта, а не личность как таковая, точнее, личность, но в соответствии с тем, как она представлена через содержание и техническое оформление соответствующего научного материала.

Таким образом, научный обмен и научные контакты становятся более интенсивными и целенаправленными, а круг единомышленников или людей, работающих в близких областях, - более обозримым. Значительное расширение контактов сопровождается в то же время и определенной условностью этих контактов. Оптимизируя распространение научного знания и научных достижений, Интернет создает новые формы социализации ученых.

Таким образом, можно судить о большой актуальности проблемы перехода к использованию web-технологий в процессе научных исследований. При успешном осуществлении этого перехода в информационное пространство возможно налаживание системы старых научных коммуникаций с более широкими возможностями. Для изучения данного вопроса было организовано исследование, состоящие из нескольких частей:

1) эмпирические исследования облачных вычислений как платформы создания информационного пространства научных коммуникаций студентов;

2) исследование сети интернет, как возможной платформы научных коммуникаций студентов

3) разработка открытого информационного портала СНО.

Данная работа посвящена разработке открытого информационного пространства студенческого научного общества на платформе облачных вычислений

Объектом исследования выступает информационное пространство научных коммуникаций Кубанского государственного университета и факультета Управления и психологии.

Предметом исследования является процесс научных исследований и система научных коммуникаций в информационном пространстве.

Цель работы - повышение эффективности научных исследований, проводимых студентами ФУП КубГУ

Указанная цель требует решение следующих задач:

1) сбор и анализ конкретного материала о применении конкретных информационных технологий и систем информационного обеспечения для решения задач научных коммуникаций в сети интернет

2) выявление и описание проблем информатизации научной деятельности;

3) разработка набора требований к порталу СНО

4) разработка портала СНО

Согласно полученным критериям было создано задание на выполнение выпускной квалификационной работы и определены основные направления предстоящей экспериментальной деятельности.

Результатом работы является портал СНО ФУП КубГУ

1. ОБЛАНЫЕ ВЫЧИСЛЕНИЯ. ПРЕИМУЩЕСТВА И ПРОБЛЕМЫ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ

1.1 Сущность облачных вычислений. модели облачных вычислений

Тема облачных вычислений становиться все популярней в бизнесе. Раньше многие компании приобретали сервера, которые затем объединяли в кластеры и центры вычисления данных, приобретали программное обеспечение, для развертывания всей инфраструктуры и построения масштабируемой системы. Затем оценивали риски, связанные с недооценкой или переоценкой загрузки,- инвестировав в разработку, и возможно не получив ожидаемого притока клиентов и поняв, что все средства были израсходованы неэффективно.

Избежать все этого позволяет модель аренды, которая может еще оказаться и экономически целесообразной, причем во многом благодаря виртуализации и оптимизации инфраструктуры провайдера услуг SaaS. Совмещение на одной физической машине нескольких виртуальных способствует сокращению расходов и оптимизации технической и информационной поддержки, а также дает возможность гибкого перераспределения ресурсов в зависимости от изменяющейся нагрузки. Однако самым важным плюсом виртуализации является сокращение времени на масштабируемость конфигурации, необходимой для решения конкретной задачи.

Например, две компании одновременно запускают аналогичный сервис, но одна строит Центр Обработки Данных самостоятельно, а другая сразу разворачивает сервис на масштабируемой облачной платформе. Каждый месяц число пользователей сервиса увеличивается в разы и очень скоро первая компания понимает, что существующих мощностей недостаточно, и тратит месяц на увеличение мощности своего Центр Обработки Данных или на переписывание приложения с учетом масштабируемости. Вторая компания в этом случае лишь увеличивает арендованные мощности. К тому моменту пока первая компания перепишет сервис или нарастит мощность оборудования, вторая переманит у нее новых клиентов.

Для решения проблемы сложности программных систем в свое время была предложена идея повторного использования кода, получившая развитие в двух направлениях - подпрограммы (процедуры и функции) и объекты.

Сначала эта идея реализовалась в виде статических библиотек, потом возникла необходимость динамически обновлять объекты - появились DLL и компоненты (COM, сборки .NET), а с появлением сетей понадобилось вызывать компонент, физически размещенный на другом компьютере, Центр Обработки Данных для чего стали использоваться протоколы типа RPC, DCOM или .NET Remoting для объектного взаимодействия (см. рис. 1). В процессе стандартизации идея вызывать код по сети трансформировалась в концепцию сервис-ориентированной архитектуры (Service-Oriented SOA), представляющую, в конечном счете, обычную абстракцию вызова кода по сети. Наиболее важной частью SOA является независимое развертывание сервисов. Если в случае DLL надо быть готовым к динамическим изменениям версии и возможностей библиотеки, то в случае SOA это явным образом заложено в архитектуру - вызывая сервис, мы не знаем, как он реализован и не можем управлять его обновлениями.

Облако - это дальнейшее развитие идей компонентного подхода, если речь идет о серверной части приложений, то одной из возможных платформ могут быть серверы, расположенные не в локальном ЦОД компании, а в облаке, из которого можно арендовать мощности. [20]

ИТ-индустрия сегодня уже сформулировала определение «облачных» вычислений, а аналитики начали рисовать радужные перспективы, представляя «облачные» вычисления не как новый вид сервиса, а как объединение разных видов сервисов, для предложения которых нужна одна инфраструктура - удаленный сервер для выполнения приложения, за работоспособность которого отвечает третья сторона. «Облачные вычисления» (cloudcomputing) -- концепция «вычислительного облака», согласно которой программы запускаются и выдают результаты работы в окно стандартного веб-браузера на локальном ПК, при этом все приложения и их данные, необходимые для работы, находятся на удаленном сервере в Интернете. «Облака» объединяют множество областей ИТ, которые раньше, имея много общего, разделялись[21]. Из «облаков» подразумевается получать платформы для вычислений (серверы и виртуальные машины) или приложений, а также сами приложения, доставляемые в рамках концепции SaaS. Работа «облака» обеспечивается неким комплексом аппаратных и программных средств - операционной системой «облака» (ОСО), которая поддерживает работу с клиентом, опираясь на сеть крупных центров хранения и обработки данных.

1.2 Основные направления развития облачных вычислений

Четыре основных направления развития облачных вычислений являются Internet-сервисы, IaaS, PaaS и SaaS. [24]

Некоторые продукты напрямую предоставляют пользователям такие Internet-сервисы, как системы хранения, программное обеспечение промежуточного слоя, поддержка совместной работы и базы данных.

IaaS (InfrastructureasaService) - инфраструктура как сервис.Аренда сервера/кластера и плата за использованные ресурсы. [26] Здесь наиболее широкие возможности для творчества - возможен выбор ОС, необходимых сервисов и написание конечных приложений. Это самый дорогой вариант, но зато имеется полная свобода действий. Типичные представители: Amazon EC2, GoGrid, ElasticHosts и др.

PaaS (PlatformasaService) - платформакаксервис.Логическое продолжение IaaS, но уже есть ОС, определённый набор ПО и все это уже настроено. Не нужно вникать глубоко в недра всей системы , т.к. уже предоставлен некий набор API для работы. Этот вариант гораздо дешевле предыдущего, но всё равно необходимо писать приложение. Оплачиваются только израсходованные ресурсы. Подходит подавляющему числу разработчиков. Типичные примеры: GoogleAppEngine, WindowsAzure, AptanaCloud.

SaaS (softwareas a Service) - программное обеспечение как сервис. Готовое приложение для конечных пользователей. Вариантов оплаты огромное множество - за ресурсы, просмотр рекламы, абонентская плата и т.д. Типичные представители: современные почтовые службы (Gmail, Yandex, Rambler), файлообменники, многие CRM/ERP-системы. Отличительной чертой является доступ к приложению посредством веб-браузера, но не всегда.

Другие *aaS: например, DaaS (Desktopas a Service) предлагает каждому пользователю стандартизированное виртуальное рабочее место, с возможностью настройки и установки других программ. Доступ осуществляется по сети посредством тонкого клиента, которым может быть что угодно от обычного ПК до смартфона (GoogleChrome OS).

CaaS (Communicationsas a Service) - сочетания программно-аппаратных средств для организации всех видов общения (голос, почта) между сотрудниками одного предприятия за счёт сторонних решений.

Альтернативный вариант SaaS продвигает корпорация Microsoft, называется он S+S (Software+Services) и сочетает в себе сильные стороны типичного SaaS и обычного десктопного приложения. Это обычное ПО, но с ориентацией на удалённые сервисы.

Вычисления в облаке превращаются в серьезную технологическую тенденцию-- многие эксперты полагают, что в ближайшие пять лет cloudcomputing изменит не только ИТ-процессы, но и сам рынок информационных технологий. Благодаря этой технологии пользователи устройств самых разных видов, в том числе ПК, ноутбуков, смартфонов и КПК, смогут получать доступ к программам, системам хранения и даже к платформам разработки приложений по Internet, через сервисы, предлагаемые провайдерами вычислений в облаке, причем ресурсы в этом случае размещаются на серверах провайдеров.

Сторонники вычислений в облаке особо подчеркивают их преимущества: снижение затрат, высокая готовность и масштабируемость. Согласно прогнозам, расходы на ИТ-сервисы из облаков (рис. 3) вырастут с 16 млрд в 2008 году до 42 млрд долл. в 2012-м. Аналитики считают, что на долю вычислений в облаке придется 25% годового увеличения расходов на ИТ к 2012 году.

1.3 Достоинства облачных вычислений

- Снижение требований к вычислительной мощности ПК. Пользователям нет необходимости покупать дорогие компьютеры, с большим объемом памяти и дисков, чтобы использовать программы через веб-интерфейс. Также нет необходимости в СD и DVD приводах, так как вся информация и программы остаются в "облаке". Пользователи могут перейти с обычных компьютеров и ноутбуков на более компактные и удобные нетбуки. Непременным условием является только наличие доступа в Интернет

- Уменьшение затрат и увеличение эффективности IT инфраструктуры. Обычные сервера средней компании загружены на10-15%. В одни периоды времени есть потребность в дополнительных вычислительных ресурсах, в других эти дорогостоящие ресурсы простаивают. Используя необходимое количество вычислительных ресурсов в "облаке" в любой момент времени, компании сокращают затраты на оборудование и его обслуживание до50%. При этом многократно увеличивается гибкость производства в постоянно меняющейся экономической обстановке.Если достаточно большая фирма обеспокоена тем, что ценная информация будет храниться и обрабатываться на стороне, для такой фирмы можно построить свое собственное "облако" и наслаждаться всеми выгодами от виртуализации инфраструктуры.

- Уменьшение проблем с обслуживанием. Так как физических серверов с внедрением CloudComputing становится меньше, их становится легче и быстрее обслуживать. Что касается программного обеспечения, то последнее установлено, настроено и обновляется в "облаке".

- Уменьшение затрат на приобретаемое программное обеспечение. Вместо приобретения пакетов программ для каждого локального пользователя, компании покупают нужные программы в "облаке".Данные программы будут использоваться толькотеми пользователями, которым эти программы необходимы в работе. Более того, стоимость программ, ориентированных на доступ через Интернет, значительно ниже, чем их аналогов для персональных компьютеров. Если программы используются не часто, то их можно просто арендовать с почасовой оплатой. Затраты на обновление программ и поддержку в работоспособном состоянии на всех рабочих мечтах вовсе сведены к нулю.

- Постоянное обновление программ. В любое время, когда пользователь запускает удаленную программу, он может быть уверен, что эта программа имеет последнюю версию - без необходимости что-то переустанавливать или платить за обновления.

- Увеличение доступных вычислительных мощностей. По сравнению с персональным компьютером вычислительная мощь, доступная пользователю "облачных" компьютеров, практически ограничена лишь размером "облака", то есть общим количеством удаленных серверов. Пользователи могут запускать более сложные задачи, с большим количеством необходимой памяти, места для хранения данных, тогда, когда это необходимо. Т.е. пользователи могут при желании легко и дешево поработать с суперкомпьютером без каких-либо фактических приобретений.

- Неограниченный объем хранимых данных. По сравнению с доступным местом для хранения информации на персональных компьютерах объем хранилища в "облаке" может гибко и автоматически подстраиваться под нужды пользователя. При хранении информации в "облаке" пользователи могут забыть об ограничениях, накладываемых обычными дисками, - "облачные" размеры исчисляются миллиардами гигабайт доступного места.

- Совместимость с большинством операционных систем. В CloudComputing операционные системы не играют никакой роли. Пользователи Unix могут обмениваться документами с пользователями MicrosoftWindowsи наоборот без каких либо-проблем. Доступ к программам и виртуальным компьютерам происходит при помощи веб-браузера или другими средствами доступа, устанавливаемые на любой персональный компьютер с любой операционной системой.

- Улучшенная совместимость форматов документов. Если пользователи пользуются одной "облачной" программой для создания и редактирования документов, у них просто нет несовместимости версий и форматов, в отличие от тех, кто, например, получит документ Word 2007 и не сможет прочитать его на локальном компьютере с Word 2003 или OpenOffice. Хорошим примером совместимости является офисный пакет GoogleDocs, позволяющий совместную работу над документами, презентациями и таблицами имея под рукой любой компьютер с веб-браузером.

- Простота совместной работы группы пользователей. При работе с документами в "облаке" нет необходимости пересылать друг другу их версии или последовательно редактировать их. Теперь пользователи могут быть увереными, что перед ними последняя версия документа и любое изменение, внесенное одним пользователем, мгновенно отражается у другого.

- Повсеместный доступ к документам. Если документы хранятся в "облаке", они могут быть доступны пользователям в любое время и в любом месте.

- Всегда самая последняя и свежая версия. В "облаке" всегда находится самая последняя и самая свежая версия программы или документа.

- Доступность с различных устройств. Пользователи CloudComputing имеют гораздо более широкий выбор устройств доступа к документам и программам.

- Дружелюбие к природе, экономное расходование ее ресурсов. CloudComputing позволяет не только экономить на электричестве, вычислительных ресурсах, физическом пространстве, занимаемом серверами, но и разумно подходить к расходованию природных ресурсов.

- Устойчивость данных к потере или краже оборудования. Если данные хранятся в "облаке", их копии автоматически распределяются по нескольким серверам, возможно находящимся на разных континентах. При краже или поломке персональных компьютеров пользователь не теряет ценную информацию, которую он к тому же может получить с любого другого компьютера.

1.4 Недостатки облачных вычислений

- Постоянное соединение с сетью Интернет. CloudComputing всегда требует соединения с сетью Интернет. Или почти всегда. Некоторые "облачные" программы загружаются на локальный компьютер и используются в то время, когда Интернет недоступен. В остальных случаях, если нет доступа в Интернет - нет работы, программ, документов.

- Плохая работа с медленным Интернет-доступом. Многие "облачные" программы требуют хорошего Интернет-соединения с большой пропускной способностью.

- Программы могут работать медленнее, чем на локальном компьютере. Некоторые программы, в которых требуется передача значительного количества информации, будут работать на локальном компьютере быстрее не только из-за ограничений скорости доступа в Интернет, но и из-за загруженности удаленных серверов и проблем на пути между пользователем и "облаком".

- Не все программы или их свойства доступны удаленно. Если сравнивать программы для локального использования и их "облачные" аналоги, последние пока проигрывают в функциональности. Например, таблицы GoogleDocs имеют гораздо меньше функций и возможностей, чем MicrosoftExcel.

- Зависимость сохранности пользовательских данных от компаний, предоставляющих услугу cloudcomputing.

- Если Ваши данные в "облаке" потеряны, они потеряны навсегда - это факт. Но потерять данные в "облаке" гораздо сложнее, чем на локальном компьютере.

- Появление новых («облачных») монополистов.

1.5 Поставщики «облаков»

Классификация поставщиков «облаков» в которой выделяются две большие группы: поставщики платформных «облаков» (ИТ-компании, предлагающие хостинг на базе собственного ПО) и поставщики «облаков» услуг, использующие для создания сервисов ПО других компаний. [41] Первая группа поставщиков делится на три подгруппы: Google, Microsoft и другие крупные компании (IBM, Apple, а также Yahoo!,EMC, HP/EDS, Amazon, Facebook, Adobe и т.д.). Ко второй группе поставщиков «облачных» вычислений можно отнести независимых сервис-провайдеров, предоставляющих услуги внешним клиентам, а также внутрикорпоративных провайдеров, обслуживающих филиалы, отделы и дочерние подразделения, а также сотрудников и партнеров.

Между платформными и сервисными поставщиками «облачных» вычислений имеется конкуренция - несмотря на большой потенциал ИТ-гигантов, услуги хостеров скоро будут востребованы и в контексте «облачных» вычислений. Этому способствует также и то, что средний и малый бизнес в поисках снижения издержек на ИТ переходит к использованию хостинга вычислительных ресурсов и при этом ищет наиболее дешевые предложения. При таком сценарии развития рынка стоимость услуг станет не единственным преимуществом независимых сервис-провайдеров - важно то, что хостеры будут проявлять более высокую гибкость и оперативность в работе с клиентами.

Постепенно уходят в прошлое и другие факторы, тормозящие развитие «облачного сервиса». Так, наряду с весьма существенным повышением надежности сетей сегодня уменьшаются и опасения компаний, связанные с потенциальной возможностью контроля провайдером услуг «облака» секретных данных предприятий.

Рассмотрим наиболее популярных поставщиков, которые предоставляют доступ к своим облакам.

При проектировании высоконагруженных Web-сервисов или Web-сайтов имеются типовые задачи, которые вполне по силам сервису из облака, поэтому разработчики Microsoft, проанализировав опыт разработки нагруженных систем, предложили свое решение для таких типовых задач. Речь идет о модели аренды сервис-хостинга высоконагруженных сайтов, сервисе исполнения произвольного кода клиента, сервисе хранения данных, а также сервисе для связывания других сервисов между собой. В результате возникла платформа AzureServicesPlatform, предоставляющая четыре основных сервиса: WindowsAzure, .NET Services, SQL Services (SQL Server в облаке) и Liveframework.

WindowsAzure - это платформа для масштабируемого хостинга Web-приложений, сценарии использования которой могут быть самыми разными, от Internet-магазина до видеохостинга или сервиса научно-технических задач.

NET Services решает задачи связывания сервисов между собой, управления доступом к методам сервиса и поддержки рабочих процессов. Такой класс решений называется InternetServiceBus (по аналогии с термином EnterpriseServicesBus). .NET Services - масштабируемый сервис уведомлений. Например, авиакомпания может предоставить сервис уведомления об отмене рейсов и появлении новых. В общем случае на такие уведомления может подписаться непрогнозируемое количество желающих: туристические агентства со всего мира, рядовые пассажиры, транспортные компании и т.п. Также в .NET Services имеется функция управления доступом AccessControl, позволяющая подключать сервисы авторизации, собирать их в одном месте и через InternetServicesBus управлять доступом к методам сервисов.

WorkflowService - масштабируемый сервис в облаке, исполняющий пользовательские рабочие процессы, заданные декларативно средствами платформы WindowsWorkflowFoundation, входящей в состав .NET начиная с версии 3.0. Сервис работает как агент, управляющий взаимодействием различных сервисов между собой, и благодаря инструментам разработки на Java и Ruby позволяет соединять гетерогенные информационные системы в единое целое.

Интересным компонентом AzureServicesPlatform является Liveframework, построенный по типу таких сервисов, как: LiveMesh, позволяющий синхронизировать файлы и папки между устройствами, распределенными, в том числе и в облаках. Что все это дает на практике - например, возможно написать приложение для игры в шахматы, запускать его со своего компьютера или напрямую с сайта LiveMesh CTP, пригласить друга, который тоже сможет запускать приложение из облака или со своего компьютера, а инфраструктура LiveFramework обеспечит синхронизацию данных.

Платформа WindowsAzure предоставляет: инструменты для разработки сервисов или сайтов; центр обработки данных, исполняющий код разработанного решения; масштабируемое хранилище данных; локальную эмуляцию сервиса, позволяющую полноценно отлаживать приложения на локальной машине; портал, на котором можно разворачивать разработанные решения, управлять выделенными мощностями и на ходу менять конфигурацию сервиса.

«Фасад» (front-end) обрабатывает Web-запросы, причем высоконагруженный сервис может потребовать несколько экземпляров «фасада», поэтому должен быть балансировщик нагрузки. Отсюда следует, что необходимо отдельное от «фасада» хранилище данных, при этом «фасад» не должен сохранять состояние. В самом деле, мы никогда не можем предсказать, какой из идентичных экземпляров «фасада» будет выполнять запрос пользователя, так что в самом «фасаде» может быть разве что кэш. В случае когда требуется запуск сложного и длительного приложения, необходима возможность запуска кода в фоновом режиме (отдельные сервисы, процессы, демоны, потоки, нити). На рис. 5 приведена схема типичного решения на Azure.

Из Internet приходят запросы на Web-сайт (или WebRole - это часть Azure-проекта), а в облаке на центре обработки данных Azure запущено несколько идентичных экземпляров вашего приложения. Балансировщик нагрузки (LB) выбирает экземпляр сайта и направляет ему запрос. Поскольку нельзя предсказать, какой экземпляр будет запущен, сайты надо (как это обычно и бывает в случае высоко нагруженных сайтов) разрабатывать таким образом, чтобы они не содержали истории своей работы.

Web-сайт может обращаться к одному или нескольким хранилищам, доступным через балансировщик нагрузки. К хранилищу, содержащему очереди, таблицы или неструктурированные данные, большие бинарные объекты (BinaryLargeOBjectS, BLOBS), также можно обращаться через Internet из других сайтов.

На фоне всего этого процесса может выполняться приложение, решающее специальные задачи, например обработку изображений в ответ на действия пользователя, заходящего на сайт. Это приложение (рабочая роль, или WorkerRole в терминологии Azure) недоступно извне и обычно получает задачи из очереди.

Стоимость подключения: Microsoft будет взимать 12 центов за час вычислений, 15 центов за гигабайт данных на сервере и 10 центов за каждые 10 тысяч транзакций. Что касается пользования сетевым каналом, то будет взиматься 10-15 центов за гигабайт.

Экономия очень сильно зависит от масштаба. «Облака» постоянно эволюционируют, для повышения надежности, уровня сервиса и для снижения издержек. Можно привести в пример - проект Джеймса Камерона «Аватар». При съемках этого фильма был создан целый виртуальный мир, в котором каждая травинка, каждый ракурс и дубль были оцифрованы и задокументированы. Объем данных этого мира превысил петабайт.

«Аватар» - крупнейший коммерческий информационный проект, в реализацию которого были вовлечены тысячи людей от США до Новой Зеландии. За все годы работы над фильмом в его информационной системе не произошло ни одного сбоя, не был утерян ни один байт. Данные хранились и управлялись облачным решением Microsoft.

GoogleAppEngine -- сервис хостинга сайтов и web-приложений на серверах Google. Использование службы аккаунтов Google позволяет быстро начать работу с приложением, нет необходимости проводить отдельную регистрацию учётных данных на каждом сайте. Это также позволяет разработчику не заботиться о реализации ещё одной системы регистрации пользователей специально для своего приложения. Платформа AppEngine тесно интегрирована с приложениями и накладывает на разработчиков некоторые ограничения. Конкурирующие среды позволяют оперировать множеством программного обеспечения, созданного под *NIX системами, в то время как AppEngine требует от разработчика обязательного использования языков программирования Python или Java и сохранения информации в собственном хранилище (Datastore).

AmazonWebServices (AWS) в данной инфраструктуре представлено много сервисов для предоставления различных услуг, таких как: хранение данных (файловый хостинг, распределённые хранилища данных), аренда виртуальных серверов, предоставление вычислительных мощностей и др. Предоставляетнесколькосервисовтакихкак: Amazon Elastic Compute Cloud (Amazon EC2), Amazon Simple Storage Service (Amazon S3), Amazon CloudFront, Amazon Simple Queue Service (Amazon SQS) идр.

AmazonElasticComputeCloud (Amazon EC2) -- веб-сервис, который предоставляет вычислительные мощности в облаке. Сервис входит в инфраструктуру AmazonWebServices. Простой веб-интерфейс сервиса позволяет получить доступ к вычислительным мощностям и настроить с минимальными затратами ресурсов. Он предоставляет пользователям полный контроль над вычислительными ресурсами, а также доступную среду для работы. Сервис сокращает время, необходимое для получения и загрузки нового сервера.

AmazonSimpleStorageService (Amazon S3) -- онлайновая веб-служба, предлагаемая AmazonWebServices, предоставляющая возможность для хранения и получения любого объёма данных, в любое время из любой точки сети, так называемый файловый хостинг. С помощью Amazon S3 достигается высокая масштабируемость, надёжность, высокая скорость и недорогая инфраструктура хранения данных.

AmazonSimpleQueueService (Amazon SQS) -- сервис принимает очереди сообщений для хранения. При использовании Amazon SQS, разработчики могут просто переместить данные, распределённые между компонентами своих приложений, которые выполняют различные задачи, не теряя при этом сообщения. При этом достигается высокая масштабируемость и надёжность.

1.6 Облачные вычисления в России

Облачные вычисления постепенно проникают в Россию. Первенцем среди коммерческих облачных сервисов SaaS стал проект Softcloud компании Softline, отечественного дистрибьютора лицензионных программных продуктов. Технологическим партнером Softcloud является Parallels -- имеющий российские корни мировой разработчик программных решений для виртуализации ИТ-инфраструктуры и автоматизации сервисов. Доступность и безопасность сервисов обеспечена благодаря хостингу в распределенной сети ЦОДов, находящихся в России, Беларуси, европейских странах и США.

2. СЕТЬ ИНТЕРНЕТ, КАК ПЛАТФОРМА НАУЧНЫХ КОММУНИКАЦИЙ

2.1 Определение и сущность сети интернет

Интернет - всемирная система объединённых компьютерных сетей. Часто упоминается как Всемирная сеть и Глобальная сеть, а также просто Сеть. Построена на базе стека протоколов TCP/IP. На основе Интернета работает Всемирная паутина (WorldWideWeb, WWW) и множество других систем передачи данных. [2]

Интернет состоит из многих тысяч корпоративных, научных, правительственных и домашних компьютерных сетей. Объединение сетей разной архитектуры и топологии стало возможно благодаря протоколу IP (англ. InternetProtocol) и принципу маршрутизации пакетов данных.

Протокол IP был специально создан агностическим в отношении физических каналов связи. То есть любая система (сеть) передачи цифровых данных, проводная или беспроводная, для которой существует стандарт инкапсуляции в неё IP-пакетов, может передавать и трафик Интернета. Агностицизм протокола IP, в частности, означает, что компьютер или маршрутизатор должен знать тип сетей, к которым он непосредственно присоединён, и уметь работать с этими сетями; но не обязан (и в большинстве случаев не может) знать, какие сети находятся за маршрутизаторами.

На стыках сетей специальные маршрутизаторы (программные или аппаратные) занимаются автоматической сортировкой и перенаправлением пакетов данных, исходя из IP-адресов получателей этих пакетов. Протокол IP образует единое адресное пространство в масштабах всего мира, но в каждой отдельной сети может существовать и собственное адресное подпространство, которое выбирается исходя из класса сети. Такая организация IP-адресов позволяет маршрутизаторам однозначно определять дальнейшее направление для каждого пакета данных. В результате между отдельными сетями Интернета не возникает конфликтов, и данные беспрепятственно и точно передаются из сети в сеть по всей планете и ближнему космосу.

Сам протокол IP был рождён в дискуссиях внутри организации IETF (англ. InternetEngineeringTaskForce; Taskforce -- группа специалистов для решения конкретной задачи), чьё название можно вольно перевести как «Группа по решению задач проектирования Интернета». IETF и её рабочие группы по сей день занимаются развитием протоколов Всемирной сети. IETF открыта для публичного участия и обсуждения. Комитеты организации публикуют так называемые документы RFC. В этих документах даются технические спецификации и точные объяснения по многим вопросам. Некоторые документы RFC возводятся организацией IAB (англ. InternetArchitectureBoard -- Совет по архитектуре Интернета) в статус стандартов Интернета (англ. InternetStandard). С 1992 года IETF, IAB и ряд других интернет-организаций входят в Общество Интернета (англ. InternetSociety, ISOC). Общество Интернета предоставляет организационную основу для разных исследовательских и консультативных групп, занимающихся развитием Интернета.

2.2 Структура

В настоящее время в Интернете существует достаточно большое количество сервисов, обеспечивающих работу со всем спектром ресурсов. Наиболее известными среди них являются:

1. сервис DNS, или система доменных имен, обеспечивающий возможность использования для адресации узлов сети мнемонических имен вместо числовых адресов;

2. электронная почта (E-mail), обеспечивающая возможность обмена сообщениями одного человека с одним или несколькими абонентами;

3. сервис IRC, предназначенный для поддержки текстового общения в реальном времени (chat);

4. телеконференции, или группы новостей (Usenet), обеспечивающие возможность коллективного обмена сообщениями;

5. сервис FTP -- система файловых архивов, обеспечивающая хранение и пересылку файлов различных типов;

6. сервис Telnet, предназначенный для управления удаленными компьютерами в терминальном режиме;

7. WorldWideWeb (WWW, W3, «Всемирная паутина») -- гипертекстовая (гипермедиа) система, предназначенная для интеграции различных сетевых ресурсов в единое информационное пространство;

Потоковое мультимедиа.

Перечисленные выше сервисы относятся к стандартным. Это означает, что принципы построения клиентского и серверного программного обеспечения, а также протоколы взаимодействия сформулированы в виде международных стандартов. Следовательно, разработчики программного обеспечения при практической реализации обязаны выдерживать общие технические требования.

Наряду со стандартными сервисами существуют и нестандартные, представляющие собой оригинальную разработку той или иной компании. В качестве примера можно привести различные системы типа InstantMessenger(своеобразные интернет-пейджеры -- ICQ, AOl, Demoson-line и т. п.), системы интернет-телефонии, трансляции радио и видео и т. д. Важной особенностью таких систем является отсутствие международных стандартов, что может привести к возникновению технических конфликтов с другими подобными сервисами.

Для стандартных сервисов также стандартизируется и интерфейс взаимодействия с протоколами транспортного уровня. В частности, за каждым программным сервером резервируются стандартные номера TCP- и UDP-портов, которые остаются неизменными независимо от особенностей той или иной фирменной реализации как компонентов сервиса, так и транспортных протоколов. Номера портов клиентского программного обеспечения так жестко не регламентируются. Это объясняется следующими факторами:

во-первых, на пользовательском узле может функционировать несколько копий клиентской программы, и каждая из них должна однозначно идентифицироваться транспортным протоколом, то есть за каждой копией должен быть закреплен свой уникальный номер порта;

во-вторых, клиенту важна регламентация портов сервера, чтобы знать, куда направлять запрос, а сервер сможет ответить клиенту, узнав адрес из поступившего запроса.

К концу 2011 года число пользователей, регулярно использующих Интернет, составило около 2,3 млрд человек

В настоящее время Интернет представляет собой один из самых активно развивающихся средств информации. По статистике, значительное число населения имеют дома компьютер и имеют доступ к сети Интернет.

Развитие Интернета открыло новые возможности для общения. Тематические рассылки, форумы, блоги, чаты создали среду, в которой легко можно найти единомышленников и обсудить с ними интересующую тему. Если речь идет о чем-то не очень сложном. При попытке вести в Интернете научные дискуссии, обнаруживается неготовность имеющихся социотехнических решений эффективно поддерживать такой тип коммуникации. Каким требованиям должна удовлетворять подобная система?

2.3 Структурированное обсуждение научных дискуссий

Прежде всего, требуются средства для структурирования научной дискуссии. Нужно четко и однозначно определить предмет обсуждения и терминологию. До перехода в фазу анализа и развития любой авторской версии, проверить и зафиксировать ее адекватное понимание участниками обсуждения. Обеспечить механизмы отделения формулировки альтернативных версий от обсуждения, развития и проблематизации текущей обсуждаемой версии.

Первая роль - Автор. Он должен полностью изложить свою версию и ответить на вопросы Понимающих, чья задача, в свою очередь, адекватно понять именно авторскую версию. Вопрос, адекватна ли она предмету обсуждения, на данном этапе не ставится. Существенным элементом, снимающим при такой работе множество проблем психологического плана, является требование зафиксировать версию в какой-то внешней форме - текст, схема (что предпочтительнее) и т.д. Это отделяет автора от версии, помогает ему самому посмотреть на нее как бы со стороны, увидеть расхождения между своим внутренним представлением и получившейся схемой. В ходе этапа понимания, Автор должен отвечать на вопросы Понимающих, уточнять и дополнять нераскрытые детали, или фиксировать, что в его версии данная степень детализации не предусмотрена. Этап понимания завершается тогда, когда Понимающий может адекватно пересказать свое понимание версии Автора (обычно такой пересказ начинается словами «правильно ли я понял, что…») и получить от того подтверждение, что такое понимание соответствует авторской версии.

Существенный момент данного этапа - запрет «двойного авторства», характерного для обычного разговора или форума, когда вместо того, чтобы понять что же сказал собеседник, его просто «стирают», выдавая другую версию. Поскольку психологически правым выглядит тот, за кем осталось последнее слово, «спор», состоящий из поочередного повторения каждым автором своей версии, может длиться до полного физического или морального истощения всех присутствующих.

Также на этапе понимания запрещена критика, которая начинается лишь после того, как зафиксировано адекватное понимание. При этом слово «критика», которое русский человек привык воспринимать скорее как синоним слов «ругань», «охаивание», подразумевается в его немецком варианте - «анализ», «развитие». Основные приемы этого этапа - уточнение авторской версии, дополнение авторской версии, выход в основание (нахождение и анализ тех пунктов, на которых базируется автор, выстраивая именно таким образом свою версию). После этапа понимания и критики возможен возврат в авторскую позицию, где излагается либо уточненная исходная версия, либо какая-то новая, нередко ей противоречащая.

Роль Организатора коммуникаций сводится к отслеживанию выполнения участниками коммуникации данной схемы, его задача следить не столько за содержанием дискуссии, сколько за соблюдением ее формы. Если в ходе коммуникации возникают противоречия по содержанию версий, снять которые не удается, предусмотрено введение «арбитража». Как правило, это построение некоторой более полной и объемлющей версии, в рамках которой противоречие снимается.

Как отмечали те, кому приходилось работать в группах по описанной схеме, она напоминает «интеллектуальный бульдозер». Т.е. скорость продвижения в материале существенно снижается, однако сметаются очень многие препятствия, казавшиеся непреодолимыми. С точки зрения реализуемости такого подхода через средства удаленной коммуникации, это не только возможно, но и имеет некоторые дополнительные плюсы, отсутствующие при работе очно. Например, достаточно легко можно разнести авторов разных версий по разным «виртуальным площадкам».

В науке термины часто получают новые, более четко очерченные смыслы, отличающиеся от общеупотребительных. Говорят, что происходит экспликация понятий. При этом, одинаковым термином могут обозначаться совершенно разные понятия, как, например, «мощность» в механике и в теории множеств.

Но даже в одной предметной области понятие редко остается статичным. Со временем может меняться его «объем». Разные авторы и научные школы могут оперировать существенно различающимися версиями понятия, обозначая его одним и тем же словом, и, тем самым, не понимая друг друга. Нужен удобный механизм, позволяющий формировать системы понятий для разных научных областей, а также фиксировать, какими версиями понятий оперирует автор. Мы предлагаем такой вариант разметки: мощность, означающий, что используется двенадцатая трактовка указанного понятия. В этом случае должны быть предусмотрены быстрый переход на описание трактовки версии и отключение пользователем отображения версий.

2.4 Эффективность поиска научной информации

Наличие множества разных смыслов одного термина существенно снижает для научных задач релевантность традиционного полнотекстового поиска. При этом требуется еще много видов поиска по различным критериям - поиск текстов, задач, методов решения, людей с заданными компетенциями и интересами и т.д. Таким образом, для обеспечения эффективного поиска, нужны механизмы выделения из текста и отдельной фиксации особых информационных единиц: фактов, гипотез, идей, проблем, задач, методов, обнаруженных ошибок и т.п. Необходим учет особенностей каждого пользователя. Нужна гибкая система оценок и рейтингов. [6]

Чтобы удовлетворить перечисленным выше требованиям, при разработке системы поддержки научной и образовательной коммуникаций, можно использовать модель классифицирующей семантической сети.

Формально семантическая сеть представляется тройкой следующего вида:

H = < I , C, G >

Здесь: I - конечное множество информационных единиц различных типов;

С - конечное множество типов связей между информационными единицами;

G - отображение, которое задает между информационными единицами, входящими в I, связи из заданного набора типов.

В системах искусственного интеллекта семантические сети давно используются для представления знаний, однако их широкое применение сдерживается сложностями формализации многих предметных областей, где нет четко определенного понятийного аппарата, или понятийная система находится в стадии становления. В описываемой концепции предлагается использовать семантическую сеть как средство структурирования научной дискуссии, позволяющее одновременно решать задачи классификации и поиска.

В рамках семантической сети легко реализовать подход, когда работа над какой-то идеей или текстом осуществляется множеством пользователей. Поскольку сформировать ценный информационный ресурс силами одних лишь разработчиков портала становится все сложнее, оптимален принцип открытости для изменений и доработок, примененный, в частности в проекте «Википедия».

Важной особенностью предлагаемой концепции является возможность декомпозиции исходного текста на отдельные смысловые элементы для их дальнейшего обсуждения и развития. На рисунке 2 показан фрагмент сети, где в публикации, классификации, анализе и доработке текста участвуют несколько пользователей. При этом сохраняется полная история сделанных изменений, доработок и декомпозиций. Легко прослеживается авторство каждой транзакции.

Кроме средств публикации, анализа, классификации, обсуждения и оценивания текстов, в структуре предлагаемой модели можно выделить еще пять взаимосвязанных логических блоков.

2.5 Онтологии предметных областей

Онтологии составляют как бы «ядро» семантической сети. Фиксируют предмет научной деятельности, уточняют его структуру. Выделение онтологии - способ отделить обсуждаемые сущности от различных вариантов их описаний, оценок, мнений и т.п., чем обеспечивается решение проблемы информационной избыточности научных публикаций. Наличие множества текстов, содержащих объяснение одного и того же явления разными способами, является объективной необходимостью. Текст - это не готовый образ, а последовательность действий по его построению, позволяющая перевести человека, имеющего все необходимые исходные представления и различения, в состояние, когда у него появляется адекватно сформированный внутренний образ описываемого явления или объекта. Но набор «исходных образов» у разных людей различен. Поэтому для создания адекватного внутреннего представления одного и того же явления, разным читателям могут понадобиться разные тексты. Для одного достаточно кратко упомянуть, что данное явление - частный случай какого-то другого, досконально ему знакомого класса явлений, для другого требуется построить сложную цепочку аналогий, чтобы создать у него внутренний образ хотя бы отдаленно адекватный описанному.

Из сказанного понятно, что проблема заключается не столько в наличии множества альтернативных формулировок, сколько в отсутствии механизма эффективного выбора из этого множества тех формулировок, которые наиболее адаптированы к уровню подготовки и особенностям восприятия конкретного читателя. В нашем случае, автор может формализовать требования к читателю и оценить затем, какое количество пользователей портала окажется в состоянии адекватно понять такой текст. Если текст оказывается недоступным для значительной части пользователей, заинтересованных в ознакомлении с данной предметной областью, следовательно, возникает потребность в создании альтернативных формулировок. Как правило, эту задачу берут на себя уже не сами исследователи или первооткрыватели, а популяризаторы, т.е. люди, умеющие просто и доходчиво объяснять сложные вещи разным категориям читателей.

В модели предусматриваются возможности обсуждения любого элемента онтологии, построения альтернативных онтологий, а также возможность фиксации нескольких версий понятия, обозначаемых одним термином, как разных онтологических единиц, связанных отношениями частичной эквивалентности. Для наиболее важных элементов модели - элементов онтологий, компетенций, задач и т.п. вводится несколько уровней согласованности: приватный - элемент вводится пользователем для себя или ограниченного круга пользователей, кандидат - элемент предлагается для внесения в общую базу портала, но находится в стадии обсуждения, утвержден - если результат обсуждения положителен, отклонен - если отрицателен.

На элементы онтологий ссылается особый тип информационных единиц - компетенции, которые характеризуют уровень представлений, знаний, умений, навыков, опыта работы пользователя по отношению к обозначенному объекту. Любая компетенция может быть разбита на ряд более мелких. Компетенции, для которых в базе портала нет дальнейшего разбиения, будем называть элементарными, остальные являются составными. Определение компетенции начинается с ее описания и обсуждения, а статус пригодной для использования она получает лишь тогда, когда появляются откалиброванные механизмы ее проверки - тесты, формализованные методики экспертной оценки, нормативы и т.п.

Одна из проблем современной образовательной системы заключается в том, что существующая система оценивания оказывается крайне неинформативной. Что означает наличие в дипломе четверки по высшей математике? Какие разделы человек освоил, а какие пропустил? Как изменилось его знание математики за время, прошедшее с момента выставления оценки? Для ответа на такие вопросы, необходимо иметь формализованное описание учащегося, состоящее не из десятка обобщенных оценок, а из нескольких тысяч элементарных компетенций, представленных для удобства обработки в электронном виде, а еще лучше, размещенном на одном из федеральных Интернет-ресурсов. Причем, наиболее важные из компетенций должны проверяться не однократно, а регулярно, на протяжении всего процесса обучения.

Для формирования системы таких описаний, требуется библиотека из десятков и сотен тысяч компетенций, создать которую можно лишь совместными усилиями всех заинтересованных пользователей. В этом смысле Интернет-портал, поддерживающий совместную работу над сложными проектами, мог бы стать идеальной площадкой для такой деятельности. По мере роста библиотеки компетенций, можно было бы ставить вопрос о создании независимых сертификационных центров, позволяющих отделить процесс обучения от процесса аттестации учащихся .

Кроме различения по «объему» освоенных представлений, знаний, умений, навыков, для компетенций вводится еще две шкалы, характеризующие уровни владения предметной областью, показанные на рисунке 5. Одна из них - это уровень доведения компетенции до практического применения, вторая - уровень творческой составляющей.

2.6 Модель пользователя

Одна из причин низкой эффективности Интернет-ресурсов для научной коммуникации - разнородный состав участников при отсутствии механизмов, которые могли бы компенсировать влияние такой неоднородности. В результате в едином пространстве и с одинаковыми возможностями оказываются и доктор наук, и пациент психдиспансера. Причем у второго, как правило, времени и энергии на «виртуальное общение» и пропаганду своих идей, имеется намного больше. Решение этой и ряда других проблем не возможно без введения модели пользователя, в которую входит совокупность его компетенций, интересов, приоритетов, планов самообразования, а также список пользователей, чье мнение является для него наиболее значимым.

Для компетенций предусмотрено несколько уровней достоверности:

подтвержденный - дипломы, степени, результаты очного тестирования и т.д.;

вероятный, где возможна «подмена личности» - публикации, заочное тестирование;

самоописание пользователя;

гипотетический - при отсутствии явной информации, система иногда может предполагать наличие компетенций по косвенным признакам.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.