Перспективы развития баз данных и систем управления базами
Поддержка мультимедийных объектов. Проблема эффективного управления новым уровнем иерархии хранения данных. Запросы к базе данных с нечеткими критериями. Поддержка пользовательских интерфейсов. Распределение информации. Безопасность и конфиденциальность.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 24.06.2013 |
Размер файла | 33,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Перспективы развития баз данных и систем управления базами
1. Поддержка мультимедийных объектов
Взрывообразный рост WWW, а также потребности областей EOSDIS, электронной коммерции, электронных публикаций порождают ряд сложных проблем, которые должны быть решены в будущих системах баз данных. Ниже рассматриваются важнейшие направления исследований, связанные с поддержкой мультимедийных данных.
Третичная память
Для хранения мультимедийных объектов требуются огромные объемы внешней памяти, что ставит перед нами новые проблемы. Для приложений типа EOSDIS или электронных библиотек характерны объемы данных масштаба петабайт. Несмотря на экспоненциальный рост емкости дисковых устройств, для размещения данных подобного объема вряд ли можно будет в ближайшем будущем обойтись только магнитными или магнитооптическими дисками. В результате встает проблема эффективного управления новым уровнем иерархии хранения данных, называемым третичной (tertiary) памятью. На третичном уровне используются носители на несколько порядков более медленные, чем на уровне «вторичной памяти» (дисков), но зато и гораздо более емкие. Устройства третичной памяти - это накопители типа стоек с компакт-дисками или магнитными лентами, где для установки нужной кассеты или ленты обычно используется механическая рука.
Доступ к третичной памяти осуществляется путем буферизации выбранных элементов данных во вторичной памяти, подобно тому, как доступ к вторичной памяти осуществляется путем буферизации дисковых блоков в оперативной памяти. Но объемы и пропорции данных здесь совершенно иные, и подходы к оптимизации обменов между вторичным и третичным уровнями существенно отличаются от методов оптимизации обменов между вторичной и оперативной памятью. Например, сегодня в качестве третичного носителя используются, в основном, кассеты с магнитными лентами. Здесь приходится учитывать не только то, что скорость считывания данных с ленты (секунды) на три порядка ниже, чем с диска (миллисекунды), но и то, что нахождение нужных данных в середине кассеты может увеличить время доступа еще на 1-2 порядка. Время доступа к данным на диске, напротив, мало зависит от их положения. Таким образом, при хранении данных на ленте необходимо решать задачу их оптимального размещения, в то время как для диска этот фактор далеко не настолько важен.
Новые типы данных
Для каждого вида мультимедийной информации (типа данных) требуется собственный набор операций и функций и их эффективная реализация на основе соответствующих структур данных и методов доступа. Например, при недавнем экспериментальном тестировании объектно-ориентированных систем было отмечено огромное расхождение в эффективности обработки больших текстовых объектов. Задача выборки последнего байта из текстовой строки длиной в мегабайт в одних системах решалась путем считывания сначала всего текста с последующим применением операции «взять последний байт», а в других - имелась возможность выборки только последнего байта или небольшого хвостового участка строки. Тщательного осмысления в связи с этим требуют следующие вопросы.
Набор операций для каждого типа мультимедийных данных, издержки их реализации.
Интеграция данных, относящихся к нескольким таким типам.
Качество обслуживания
С доставкой мультимедийных данных сразу нескольким пользователям связан ряд новых исследовательских проблем. В общем случае, если объем данных велик, доступ к ним и доставка результатов выборки могут стать узкими местами. Однако доступ к большим мультимедийным объектам часто осуществляется в очень предсказуемой манере. Например, видеосервер, доставляющий фильмы в несколько домашних видеосистем, может исходить из предположения, что каждый запрос на последовательный просмотр со стандартной скоростью будет оставаться в силе, пока пользователь не нажмет кнопку «стоп». Предсказуемость позволяет оптимизировать реализацию запросов, причем подобные предположения обычно достаточно хорошо оправдываются.
Доставка мультимедийной информации во многих случаях должна удовлетворять довольно жестким ограничениям. Так, видеофильм должен доставляться с фиксированной скоростью, иначе будет наблюдаться мигание и задержки кадров. Еще более жесткие ограничения накладываются на процесс доставки аудиоинформации, ассоциированной с фильмом. Если неравномерность доставки видеокадров можно компенсировать за счет алгоритмов интерполяции, которые дают достаточно хороший эффект, то для аудиоданных это невозможно. Ситуация усложняется еще и тем, что разные типы аудио- и видеоинформации обладают разной степенью «терпимости» к погрешностям воспроизведения. Так, для видеокурса лекций допустимой может быть скорость доставки 1 кадр в секунду и ниже, поскольку значимым здесь является только изображение записей, которые лектор делает на доске, или слайдов, которые он показывает.
Эти примеры показывают потребность в исследованиях «качества обслуживания». Для каждой формы мультимедийных данных требуется ответить на следующие вопросы.
Как обеспечить своевременное и реалистичное представление данных в естественной для них форме?
Если система не в состоянии обеспечить ожидаемое качество обслуживания, то каковы допустимые способы частичной компенсации? Возможна ли интерполяция или экстраполяция отдельных видов данных? Следует ли отвергать вновь поступающие запросы и нужно ли отменять уже принятые?
Запросы с нечеткими критериями
Запросы к базе данных традиционно оперируют с четкими понятиями, например: «каков пункт назначения рейса номер 233?» или «каков остаток на счете номер 45678?». Многим новым приложениям приходится иметь дело с запросами, включающими нечетко определенные понятия, которые позволяют находить наилучшее доступное значение из нестрого определенного набора слабо интегрированных ресурсов. Если, допустим, нам захотелось бы получить снятое со спутника изображение заданного района в заданное время, то следовало бы запросить у EOSDIS «наилучшее» в каком-то смысле приближение. Возможно, это будет изображение, включающее данный район и наиболее близкое по времени к интересующему моменту. Для этого требуется выработать новые языки запросов или усовершенствовать существующие языки, включив в них в качестве базовых такие понятия, как степени свободы и желаемая точность приближенного результата.
Имеются экспериментальные системы, которые умеют выбирать из базы данных графические образы на основе таких нечетких характеристик, как цвет, форма, текстура. Системы этого типа потенциально способны по нечеткому описанию содержимого производить выборки в среде графических образов, аудио- и видеоинформации, подобно тому, как существующие системы позволяют выбирать текстовые или числовые данные по значению какого-либо поля. Но реально здесь необходим еще значительный объем исследований.
Поддержка пользовательских интерфейсов
SQL и надстраиваемые над ним языковые формы более высокого уровня хороши для доступа к данным, структурированным в записи. Когда речь идет о мультимедийных данных, часто необходимы совершенно другие формы пользовательских интерфейсов, и СУБД должны их поддерживать. Например, запросы географических данных (карт) удобнее всего формулировать, указывая интересующий район на схеме материка (страны, города и т.п.), изображенной на экране, и очень сложно, если не невозможно, сформулировать такой запрос в терминах SQL. Для упоминавшихся в разд. 1.1.4 баз данных графических образов необходимы интерфейсы, позволяющие задавать цвета, формы и другие характеристики изображения. С каждым типом мультимедийных данных связана проблема создания простых средств для формулирования запросов.
В связи с мультимедийными видами информации возникает также проблема разработки новых средств для просмотра, поиска, визуализации содержимого мультимедийных баз данных. Например, курс лекций может содержать десятки часов видеоматериала. Естественно, хотелось бы иметь способы быстрого просмотра, чтобы решить, стоит ли этот курс заказывать, или чтобы отыскать в нем, скажем, десятиминутный или часовой фрагмент по интересующей теме. Нужны соответствующие методы доступа, и здесь возможны самые разные подходы - это могут быть наборы ключевых кадров, текстовые индексы, средства поиска сегментов, обладающих заданными характеристиками.
Еще один пример - снимки, полученные со спутников. Как правило, их объем велик, и передача множества снимков, среди которых пользователь будет искать нужные ему, требует слишком много времени. Здесь может помочь выборка фрагментов, содержащих существенные элементы исходных снимков. В результате человек получает возможность быстро просмотреть большое число изображений и отобрать то, что его интересует, например снимки вулканических выбросов.
Приведенные здесь примеры можно экстраполировать и на другие ситуации, когда необходимо предоставить пользователю средства для быстрой и эффективной визуализации содержимого больших объектов данных. Это одна из важнейших проблем следующего поколения систем баз данных.
2. Распределение информации
Как уже упоминалось, WWW - это распределенная среда, состоящая из автономных систем, узлы которой все чаще формируются как реляционные базы данных. Точно так же пользование электронными публикациями предполагает наличие распределенной системы, в которой имеется довольно низкий уровень доверия между клиентом и сервером. Хотя исследовательское сообщество весьма интенсивно занималось вопросами распределенных баз данных, и плоды этих усилий находят отражение в коммерческих продуктах, новая среда, возникшая в рамках WWW, заставляет переосмыслить многие концепции существующей технологии распределенных баз данных. В настоящем разделе обозначены основные направления исследований в этой области.
Степень автономности
Базы данных и другие источники информации, связанные посредством сети, зачастую принадлежат разным владельцам. Примерами такой ситуации могут служить распределенные системы здравоохранения, распределенные системы проектирования, а также WWW. Автономность участников распределенной системы создает множество специальных проблем в распределенных системах баз данных.
В распределенной системе необходимо предусмотреть ситуации, когда отдельные партнеры отвергают запросы на подключение. Разные партнеры могут использовать системы с разными возможностями. Например, в системах проектирования наилучшим способом поддержки согласованности будут распределенные ограничения или активные правила, возбуждающие проверку условий, которые могут охватывать нескольких автономных партнеров. Как обеспечить соблюдение необходимых условий, если отдельные участники не имеют или не хотят использовать в своих системах механизмы активных правил?
Учет и расчеты
В локально автономных системах сервер может в уплату за предоставление сервиса потребовать перечисления определенной денежной суммы. В прежних распределенных СУБД предполагалось, что вся информация является собственностью одной корпорации, и этот «неудобный» вопрос не возникал.
В среде, где информация является предметом продажи, необходима реализация новых стратегий для «измерения» услуг и взимания с пользователей небольшой суммы за каждый доступ к удаленным данным. Эффективный сбор таких средств также составляет предмет исследований. Разумеется, нецелесообразно тратить рубль на то, чтобы получить с пользователя копейку.
Еще один интересный вопрос - выработка стратегий реализации запросов с учетом их денежной стоимости. Допустим, вас интересует библиография публикаций о динозаврах. Местный музей предоставляет информацию бесплатно, но она может быть менее полной, чем та, которой располагает коммерческая библиографическая служба. Желательно, чтобы механизм реализации запросов учитывал плату, взимаемую разными источниками, и использовал бы, в первую очередь, бесплатные источники. Предположим, что после извлечения бесплатных данных запрос к дорогостоящему источнику был бы сформулирован следующим образом: «Пришлите список всех публикаций о динозаврах, за исключением следующих 2000, о которых я уже знаю». Логично предположить, что коммерческая служба отвергнет подобный запрос, реализация которого потребует больших затрат ресурсов, а результат, скорее всего, окажется мизерным или пустым, и плата за него будет невелика (что, впрочем, зависит от алгоритма вычисления стоимости). Задача исследователей состоит в разработке согласованных механизмов ценообразования, сервисных политик, алгоритмов оптимизации с учетом цен, алгоритмов обработки счетов за обслуживание.
Безопасность и конфиденциальность
В распределенных системах, включающих автономных партнеров, требуется поддержка безопасности информации. Во многих случаях это нужно для обеспечения конфиденциальности персональных данных. Например, информационная система здравоохранения должна беспрепятственно предоставлять информацию о пациенте его лечащему врачу, но обязана защитить ее от несанкционированного доступа. В других случаях необходимость защиты связана с коммерческой ценностью данных. Примеры - распределенное проектирование и электронные публикации. Можно выделить следующие важные направления исследований.
Разработка исключительно гибких систем аутентификации и авторизации, поддерживающих доступ на основе разнообразных «ролей», исполняемых пользователями. Так, один и тот же индивид может выступать в роли лечащего врача некоторого пациента, в роли «врача вообще» или в роли частного лица.
Выработка механизмов для продажи информации большому числу пользователей, личности которых неизвестны продавцу.
Репликация и согласование данных
Фундаментальная проблема управления распределенной базой данных - нахождение способов функционирования в ситуации, когда сеть распадается на две или более несвязанные группы узлов. Когда врач садится в самолет, имея при себе историю болезни своего пациента, он должен иметь возможность вносить в нее записи, т.е. изменять содержимое базы данных, несмотря на то, что он отключен от сети, пока находится в самолете.
Разумеется, компоненты базы данных, связь между которыми сохраняется, должны продолжать функционировать независимо наилучшим возможным способом. Запросы на выборку и модификацию данных, затрагивающие доступные узлы, должны выполняться, а остальные - отвергаться.
Из соображений эффективности данные часто реплицируются на нескольких узлах. Когда все эти узлы связаны сетью, можно поддерживать идентичность копий. Однако в ситуациях, когда связь нарушается, в копиях могут появиться различия. После восстановления связи должен включаться механизм согласования (reconciliation), который должен согласовать все копии и сформировать одну новую копию, отражающую все сделанные изменения.
С точки зрения традиционных распределенных баз данных, утрата связности сети - это случай исключительный, аномальный, и поэтому процесс восстановления и согласования данных мог быть сложным и занимать относительно много времени. В новой информационной среде, как показывает приведенный выше пример, подобные ситуации становятся уже не исключением, а нормой. Отсюда необходимость создания быстрых протоколов и алгоритмов согласования.
Отметим также, что, в связи с растущей зависимостью производственных процессов от информационных систем, для многих приложений необходимым требованием становится стопроцентная доступность, или, как это иногда обозначают, «доступность 7х24» (7 дней в неделю х 24 часа в сутки). Некоторые проблемы повышения надежности решаются за счет совершенствования аппаратных средств. Однако в среде баз данных для повышения доступности необходимо исследование новых репликационных схем, обеспечивающих идентичность копий данных и корректное функционирование системы в условиях отказа отдельных компонентов.
Интеграция и преобразование данных
Крупные информационные системы типа систем поддержки здравоохранения, подразумевают наличие взаимосвязи информационных ресурсов, основанных на самых разных форматах и моделях данных. По-видимому, подобные системы должны иметь в качестве центрального звена некоторую интегрирующую модель и соответствующую нотацию. Каждый источник данных обертываться (wrapped) некоторым компонентом, осуществляющим преобразования между частным представлением источника данных и глобальным представлением, принятым в интегрируемой среде. На основе этих «обернутых» источников затем могут создаваться прикладные продукты более высокого уровня.
С проблемой преобразования и интеграции данных связано много вопросов.
Какой должна быть интегрирующая модель?
Какой нужен инструментарий, чтобы сделать использование произвольных источников данных в интегрированных системах столь же простым, как работу с индивидуальными базами данных?
Как расширить идею словаря данных, чтобы обеспечить корректное использование терминологии в среде, состоящей из интегрированных гетерогенных источников? Эта проблема, по существу, совпадает с «онтологической задачей» искусственного интеллекта.
Один из подходов к проблеме комбинирования разнородных источников информации состоит в применении медиаторов (mediator), компонентов, которые могут производить настраиваемую интеграцию, возможно, с дополнительной фильтрацией или обработкой. По своей роли они аналогичны «агентам» сообщества искусственного интеллекта. Как лучше всего применить здесь этот подход - еще одна важная исследовательская тема.
Выборка и обнаружение данных
Очевидно, все больше и больше информации будет доступно в Web, коллекции неформально связанных ресурсов Internet. Неформальность и распределенный характер управления в среде Web представляют разительный контраст в сравнении со структурированностью и управляемостью, характерными для современных распределенных баз данных. Возникновение этой новой среды еще раз подтверждает важную роль инструментов для интеграции гетерогенных информационных ресурсов.
Однако природа Web порождает ряд новых проблем, а также примеров, которые иллюстрируют крайние случаи многих проблем, связанных с гетерогенной информационной средой. Например, приходится иметь дело со следующим:
Имеются данные с нечеткой схемой, которая может произвольно меняться, или с нерегулярной структурой.
Данные, не имеющие четкого определения и / или обладающие неизвестной достоверностью.
В рамках технологий СУБД выработаны эффективные механизмы индексации и другие средства поддержки поиска для хорошо структурированных данных; очень важно расширить подобные механизмы и адаптировать их к неструктурированному миру Web.
Качество данных
В силу ненадежности механизмов ввода информации всегда существовала проблема проверки правильности содержимого баз данных. В новых приложениях информация часто комбинируется на основе разных источников, степень надежности которых различна. Следовательно, требуются методы для оценки достоверности полученной таким образом информации. Нужны также средства для опроса достоверности или происхождения (lineage) данных. В идеале понятия достоверности и происхождения должны стать базовыми для новых языков запросов.
3. Новые применения баз данных
Традиционно системы баз данных использовались для поддержки приложений обработки бизнес-данных, и основные направления исследований были ориентированы именно на этот класс приложений. В последнее время образовались новые важные области применения баз данных, и каждая из них представляет принципиально новую среду, к которой необходимо адаптировать технологии СУБД. Эти области получили на рынке названия интеллектульного анализа данных (data mining), хранилищ данных (data warehousing), репозитариев данных (data repository), и далее мы их по очереди обсудим.
Интеллектуальный анализ данных
Идея интеллектуального анализа данных (data mining), т.е. извлечения информации из огромных массивов данных, накопленных совсем для других целей, вызывает сегодня повышенный энтузиазм. Например, авиакомпании добиваются оптимального заполнения рейсов за счет анализа накопленных ранее данных о резервировании билетов. Можно привести еще одну совершенно замечательную историю о том, как была обнаружена неожиданная корреляция между покупками пива и покупками салфеток в послеобеденный период. Владелец магазина приблизил друг к другу отделы, торгующие пивом и салфетками, а между ними поместил еще прилавки с картофельными чипсами. В результате увеличились продажи всех трех видов товара.
С запросами, характерными для систем интеллектульного анализа данных, связан ряд необычных проблем.
Они включают, как правило, агрегацию огромных объемов данных.
Они имеют нерегламентированный характер; их формулируют лица, ответственные за принятие решений, когда им необходимо выявить какие-либо неочевидные взаимосвязи.
В приложениях, связанных, например, с торговлей ценными бумагами, очень важно малое время ответа. Суть проблемы состоит здесь в том, чтобы сократить общее время, необходимое для написания, отладки и выполнения запроса.
Довольно часто пользователь не в состоянии точно сформулировать запрос - ему просто нужно обнаружить «что-нибудь любопытное».
Таким образом, с добычей данных связаны следующие исследовательские направления.
Методы оптимизации сложных запросов, включающих, например, агрегацию и группирование.
Методы поддержки «многомерных» запросов, относящихся к данным, организованным в виде «куба», в ячейках которого находятся интересующие данные (например объемы продаж). «Измерениями» такого куба могут быть дата продажи, название магазина, наименование товара, цвет, поставщик.
Методы оптимизации использования третичной памяти.
Языки запросов очень высокого уровня, а также интерфейсы для поддержки пользователей, не являющихся экспертами, которым нужны ответы на нерегламентированные запросы.
Хранилища данных
В хранилище данных накапливаются данные из одной или более баз данных. Существует множество потенциальных применений, а также подходов к организации хранилищ данных. Например, крупный магазин может поддерживать хранилище данных на основе транзакционных данных о кассовых операциях для целей добычи данных (разд. 1.3.1). В хранилище данных может сохраняться информация из многих баз данных для использования в чрезвычайных ситуациях. Например, в едином хранилище данных поддерживаются сведения о гражданской инфраструктуре (дороги, мосты, трубопроводы и т.п.), поскольку, например, после землетрясения вряд ли удастся получить эту информацию из городов, находящихся вблизи эпицентра. Еще один пример - использование хранилища данных как «материализованного представления» интегрированной информации. В 1.2.5 обсуждалась идея медиаторов, которые дают целостное представление данных, извлеченных из множества источников. Альтернативой медиаторных систем могут служить хранилища данных, обеспечивающие физическое хранение интегрированных данных. В отличие от хранилищ, медиаторы предоставляют информацию, рассылая запросы нескольким источникам, подобно тому, как это происходит при реализации представлений.
Некоторые исследовательские проблемы, касающиеся хранилищ данных, совпадают с теми, которые характерны для интеграции данных в целом, но есть и некоторые специфические проблемы.
Инструменты для создания насосов данных (data pump), т.е. модулей, функционирующих над средой источников данных и поставляющих в хранилище те изменения, которые существенны с точки зрения хранилища; при этом данные должны транслироваться в соответствии с глобальной моделью и схемой хранилища.
Методы «чистки данных» (data scrubbing), которые обеспечивают согласование данных, удаление элементов, соответствующих разным представлениям одного и того же объекта (например «Sally Tones» и «S.A. Tones»), а также удаление неправдоподобных значений.
Средства для создания и поддержания метасловаря, информирующего пользователей о способах получения данных.
Репозитарии
Приложения, относящиеся к категории репозитариев, характеризуются тем, что они предназначаются для хранения и управления как данными, так и метаданными, т.е. информацией о структуре данных. Примеры репозитариев - базы данных для поддержки компьютерного проектирования, включая CASE (системы проектирования программного обеспечения), а также системы управления документами. Отличительная черта этих систем - частые изменения метаданных, характерные для любой среды проектирования.
В репозитарии необходимо поддерживать множество представлений одной и той же или схожей информации. Например, программный модуль имеет представление в виде исходного кода, объектного кода, промежуточного кода, готовой программы, таблиц использований / определений, документации. Связи между всеми этими представлениями должны отслеживаться репозитарием так, чтобы изменения в одном из них автоматически распространялись на остальные представления того же объекта.
Репозитарии должны поддерживать понятие версий (моментальных снимков элементов данных, меняюшихся во времени) и конфигураций (версионных коллекций версий). Например, разные релизы программной системы будут обычно формироваться как конфигурации из определенных версий файлов исходного кода.
Репозитарий должен поддерживать эволюцию структуры информации и ее метаданных таким образом, чтобы при добавлении новых свойств данных или новых связей не требовалась полная перекомпиляция.
Цель исследований в этой области - создание «систем управления репозитариями», подобных сегодняшим СУБД.
4. Управление потоками работ и транзакциями
По мере того как базы данных получают все более широкое распространение, и сферы их применения выходят за рамки, предусмотренные бизнес-сообществом, традиционная модель транзакций перестает быть удовлетворительной. Транзакции сейчас могут охватывать множество «независимых» баз данных и не ограничиваться кратким промежутком времени.
Управление потоками работ
Часто бизнес-процессы включают и компьютеризованные шаги, где используются базы данных и другие информационные ресурсы, и шаги, где требуется вмешательство персонала. Например, отчет о командировке сначала заполняется сотрудником вручную, затем секретарь вводит его в компьютерную систему, где он автоматически преобразуется в формат бланка для возмещения затрат, после чего направляется клерку, который принимает его или отвергает, используя электронные средства. Если отчет принят, то он направляется в бухгалтерскую подсистему, которая запоминает сумму расходов и генерирует чек. Еще более необходимы средства управления потоками работ, интегрированные в СУБД, если процесс включает обработку мультимедийных документов. Оцифровка бумажного документа включает последовательность шагов, требующих человеческого вмешательства: сканирование, оптическое распознавание текста, проверка и исправление ошибок, регистрация обработанного документа.
Как показывают эти примеры, подобные процессы требуют специальных способов управления данными с поддержкой последовательности взаимозависимых событий. Причем, с некоторыми из этих событий могут быть связаны длительные задержки, например, если клерк находится в отпуске, а заменяющий его сотрудник ушел обедать. Алгоритмы обработки могут включать ветвления и даже откаты, если, скажем, отчет отвергнут, и его необходимо исправить для последующего принятия. Так же, как и для репозитариев (разд. 1.3.3), требуются соответствующие системы управления потоками работ, поддерживающие специфические для этих приложений требования. Требуются также специальные инструменты для проектирования и создания потоков работ, а также для управления ими.
Альтернативные модели транзакций
Транзакции - это единицы обработки данных, обладающие свойствами, существенными с точки зрения традиционных СУБД: атомарность (выполняются либо все действия, либо ни одного), сериализуемость (разные транзакции не оказывают неожиданного воздействия друг на друга) и долговечность (если транзакция зафиксирована, то ее результат не пропадет даже в случае краха системы). Эти свойства сохраняют свою значимость и для многих новых приложений, однако принятые методы реализации транзакций часто оказываются неработоспособными. Некоторые приложения требуют очень продолжительных шагов, как, например, системы проектирования, где инженер изымает из обращения элементы конструкций на несколько часов или дней. Еще один пример - системы управления потоками работ, где действия, выполняемые персоналом, могут также занимать многие часы или несколько суток.
Были предложены альтернативные модели, основанные на концепциях вложенных транзакций, когда одна длительная транзакция разбивается на более мелкие шаги, и транзакций - «саг» (saga), для которых обеспечивается возможность отменять результаты шагов, которые оказываются заблокированными последующими шагами. Необходимо усовершенствовать эти модели и развить их таким образом, чтобы обеспечить поддержку более широкого класса транзакций, в том числе для приложений CAD и потоков работ, а также других типов систем, которые будут появляться по мере интеграции большого числа автономных информационных источников.
5. Простота использования
По мере того как возрастает значение информации в обществе, столь же быстро растет и роль баз данных. К небольшому числу крупных систем, существовавших несколько лет назад, присоединилось огромное количество более мелких систем (а также новые крупные). Однако сложность развертывания и использования подобных систем не соответствует темпам их распространения.
СУБД следующего поколения должны обладать более совершенными интерфейсами, причем не только для конечного пользователя, но и для прикладного программиста и администратора. Целью здесь нужно считать создание баз данных, столь же простых в использовании, как электронные таблицы, которые часто применяются в качестве рудиментарных систем баз данных.
Задачи установки СУБД или перехода к ее новой версии значительно более громоздки, чем аналогичные задачи для других типов систем. Это неудивительно, если учесть размеры СУБД, их сложность и разнообразие аппаратных конфигураций, на которых они должны работать. Тем не менее, мы считаем нужным выдвинуть исследовательскую программу, цель которой - создание интеллектуального инструментария, помогающего системным менеджерам в установке и конфигурировании систем. Современные операционные системы окружены целым слоем «помощников» (wizard), которые обеспечивают их эффективную работу. Подобные «электронные помощники» нужны и для снижения затрат ручного труда по обслуживанию крупных приложений баз данных.
С этим же направлением связана и задача интеллектуальной поддержки высокой производительности. Самый распространенный тип звонков в консультационные службы фирм-поставщиков СУБД - это жалоба на то, что «такой-то и такой-то запрос выполняется слишком медленно». Существуют теории подбора индексов и оптимизации схем баз данных, которые могли бы помочь в решении подобных проблем, и здесь нужны электронные «инструменты для физического конструирования баз данных».
Выводы
Технологическая среда в Соединенных Штатах и во всем мире меняется очень быстро, и вместе с этим расширяются наши представления о сферах применимости баз данных. Растущие информационные потребности общества отчетливо выявляют ограничения существующих технологий СУБД, и задача исследовательского сообщества - самым энергичным образом устремить свои усилия на эти новые направления. Спектр возможностей и потребностей здесь широк, как никогда, - от сугубо теоретических изысканий в области создания новых моделей и алгоритмических основ до реализации прототипов новаторских систем. В то же время, уровень финансирования исследований в области баз данных существенно ниже, чем в других сравнимых по значимости сферах.
Поэтому участники семинара рекомендуют вновь призвать к активности правительственные агентства, занимающиеся продвижением работ в области баз данных, а также те коммерческие структуры, которые извлекают выгоду из результатов этих исследований.
В заключение мы хотим напомнить две важные рекомендации из отчета, не утратившие своего значения и сегодня.
NSF вместе с другими организациями Федерального координационного совета (Federal Coordinating Council) по науке, проектированию и технологиям, занимающимися финансированием фундаментальных исследований, должны, при участии академических и промышленных кругов, выработать стратегию, которая бы обеспечила уровень финансирования исследований в области баз данных, соответствующий их значению для развития науки и национального экономического благополучия.
Промышленные фирмы США, существенно опирающиеся в своей деятельности на технологии баз данных, должны оказать интенсивную поддержку в реализации существующих программ и принять участие в создании новых программ по финансированию университетских исследований в области баз данных.
Мы предвидим десятилетие впечатляющих достижений как в академических, так и в индустриальных исследовательских кругах и надеемся на динамичную и активную поддержку со стороны государственных и коммерческих структур.
мультимедийный база информация безопасность
Размещено на Allbest.ru
Подобные документы
Структура и функции системы управления базами данных (СУБД). Управление хранением данных и доступом к ним. Защита и поддержка целостности данных. Надежность хранения данных во внешней памяти. Классификация СУБД по способу доступа к базе данных.
презентация [3,7 M], добавлен 05.06.2014Хранение и обработка данных. Компоненты системы баз данных. Физическая структура данных. Создание таблиц в MS Access. Загрузка данных, запросы к базе данных. Разработка информационной системы с применением системы управления базами данных MS Access.
курсовая работа [694,0 K], добавлен 17.12.2016Тенденция развития систем управления базами данных. Иерархические и сетевые модели СУБД. Основные требования к распределенной базе данных. Обработка распределенных запросов, межоперабельность. Технология тиражирования данных и многозвенная архитектура.
реферат [118,3 K], добавлен 29.11.2010Классификации баз данных по характеру сберегаемой информации, способу хранения данных и структуре их организации. Современные системы управления базами данных и программы для их создания: Microsoft Office Access, Cronos Plus, Base Editor, My SQL.
презентация [244,3 K], добавлен 03.06.2014Система управления базами данных как составная часть автоматизированного банка данных. Структура и функции системы управления базами данных. Классификация СУБД по способу доступа к базе данных. Язык SQL в системах управления базами данных, СУБД Microsoft.
реферат [46,4 K], добавлен 01.11.2009Организация хранения мультимедийных данных, основные виды систем управления базами данных и их характеристика. Магнитные и оптические запоминающие устройства. Файловые системы для оптических носителей. Иерархическое управление запоминающими устройствами.
презентация [93,4 K], добавлен 11.10.2013Характеристики распределенной системы управления базой данных. Уровни представления информации в распределенной базе. Сравнительные характеристики стратегий хранения информации: централизованной, расчленения (фрагментации), дублирования, смешанной.
курсовая работа [1,7 M], добавлен 16.05.2014Объекты системы управления базами данных Access. Запросы, формы, отчеты. Типы данных: текстовый, поле мемо, числовой. Поле объекта OLE, гиперссылка, мастер подстановок. Ручные, автоматизированные и автоматические средства создания объектов базы данных.
презентация [872,0 K], добавлен 31.10.2016Особенности управления информацией в экономике. Понятие и функции системы управления базами данных, использование стандартного реляционного языка запросов. Средства организации баз данных и работа с ними. Системы управления базами данных в экономике.
контрольная работа [19,9 K], добавлен 16.11.2010Алгоритмы обработки массивов данных. Система управления базами данных. Реляционная модель данных. Представление информации в виде таблицы. Система управления базами данных реляционного типа. Графический многооконный интерфейс.
контрольная работа [2,8 M], добавлен 07.01.2007