Базы данных

Три уровня восприятия данных. Информационная система на основе системы управления базами данных. Особенности построения сетевой модели. Основная единица обработки в иерархической модели. Набор в сетевой модели данных, его типы, используемый язык.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 16.10.2013
Размер файла 265,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Базы данных

Общие понятия

Базы данных - что это? Ведь ранее мы говорили об информационных хранилищах. Информационное хранилище является частью информационной системы. Но мы никак не уточняли, какова структура таких хранилищ. В действительности обычному пользователю нет нужды знать эту структуру. При работе с ИС он оперирует профессиональными терминами и понятиями. Например, бухгалтер, при работе с бухгалтерской информационной системой имеет дело с такими объектами как счет, проводка, журнал, платежный документ и т.д. Он не знает, как в действительности устроено информационное хранилище, да и не должен знать, так как каждый должен заниматься своим делом, а поверхностные знания, часто приводят к отрицательным результатам.

Таким образом, информационное хранилище является общим понятием, отражающим факт наличия в системе хранимых данных. Для пользователя те объекты, которыми он оперирует при работе с ИС и есть те самые хранимые данные. С другой стороны грамотный компьютерщик знает, что все данные хранятся в файлах. Файлы - это те объекты хранения данных, которыми манипулирует операционная система. Но файлы, это всего лишь именованная последовательность хранимых во внешней памяти байтов. Однако при создании информационной системы не слишком удобно оперировать последовательностями байтов. Непосредственно с файлами работают системные программисты. Прикладные программисты работают с другой абстракцией. Эта абстракция находится на среднем уровне между уровнем файловой системы (физический или внутренний уровень) и уровнем пользователя (внешний уровень). Назовем это промежуточный уровень логическим или прикладным уровнем. Сказанное выше проиллюстрировано на рисунке 2.3.

И так для конечного пользователя информационное хранилище состоит из значений тех показателей, которыми он оперирует в силу своей профессиональной деятельности. Для системного программиста информационное хранилище представляет собой набор файлов. Для прикладного же программиста и администратора ИС информационное хранилище представляет собой некоторое абстрактную структуру, отражающую предметную область. Этот уровень и принято описывать с помощью понятия база данных. Информационное хранилище может состоять из нескольких баз данных, идентифицируемых своим именем. Структура базы данных строится на основе модели данных, о которых мы будем говорить в следующем разделе. Важно отметить, что модель данных, по сути, представляет собой некоторый язык, с помощью которого может быть описана предметная область. Такое описание не должно зависеть от аппаратной и программной части системы. В описание должен входить и набор типовых операций над данными.

Рис. 2.3. Три уровня восприятия данных

Определение

Базой данных будем называть именованную часть информационного хранилища, структура которой описывается на языке некоторой модели данных. Описание структуры конкретной базы данных называется схемой, системным каталогом (или просто каталогом) базы данных или словарем.

СУБД

СУБД - это система управления базами данных. Для того чтобы понять, что такое СУБД обратимся снова к рисунку 2.3. Для того, чтобы прикладные программисты видели базу данных не в виде набора файлов, а как некоторую структуру, которая описывает предметную область, между ними и файловой системой должна быть некоторая прослойка. Это прослойка представляет собой набор процедур (программный интерфейс), с помощью которого прикладной программист может управлять базой данных. Эту функцию выполняет СУБД. Другими словами СУБД отделяет работу прикладного программиста от физической структуры базы данных. В простейшем случае СУБД состоит только из программного интерфейса. Так обстоит дело в некоторых системах программирования. В более сложных системах мы имеем также и интегрированную среду, позволяющую в интерактивном режиме управлять базами данных. Кроме этого СУБД также предоставляет разработчикам средства безопасности. Такие, например, как резервное копирование, поддержка параллельной работы приложений, система поддержки целостности баз данных, транзакционные механизмы, парольный вход и разделение доступа и др. Большинство современных информационных систем строятся именно на основе СУБД.

На рисунке 2.4 представлена схема взаимодействие СУБД и прикладного программного обеспечения в схеме построения информационной системы. Тут важно понять, что база данных в определенной модели существует для прикладного программного обеспечения, тогда как программное обеспечение СУБД взаимодействует с данными на уровне файловой системы и системных вызовов операционной системы.

Рис. 2.4. Информационная система на основе СУБД

Все СУБД могут быть поделены на настольные и промышленные. Настольные СУБД, такие как Access, FoxPro предназначены для создания либо автономных информационных систем, либо ИС файл-серверного типа. Промышленные СУБД, такие как Oracle, MS SQL Server, Postgress и др. предназначены для построения клиент-серверных информационных систем. СУБД, как правило, предоставляет разработчику язык программирования, который включает в себя специализированный язык управления базами данных. Для наиболее распространенных баз данных реляционного типа таким языком является язык SQL.

Использование СУБД при построении информационных систем призвано реализовать физическую и логическую независимость прикладного программирования от данных. Физическая независимость от данных заключается в том, что работа программного обеспечения ИС не будет зависеть от изменений, которые могут происходить на внутреннем, физическом уровне. Эти изменения могут заключаться, например, в том, что будет изменена файловая система или же в том, что изменится структура тех файлов, которые составляют базу данных.

Логическая независимость прикладного программирования от данных при использовании СУБД в трехуровневой структуре доступа к данным (см. рисунок 2.3) заключается, прежде всего, в том, что добавление новых элементов (например, добавление нового столбца в таблицу) в структуру данных никак не влияет на функционирование программного обеспечения.

Модели данных

Рассмотрим основные модели данных, которые используются (или использовались) при создании информационных систем. Перечень существующих моделей данных являются в тоже время и хронологическими метками истории развития баз данных и информационных систем.

Файловая модель

Иногда файловую модель, на мой взгляд, очень неудачно, называют файловой системой. При этом упускается из вида тот факт, что данный термин используется для обозначения организации данных во внешней памяти, которую поддерживают и используют операционные системы. Файловая модель была первой моделью, используемой при разработке информационных систем[1]. Точнее модель, как таковая, отсутствовала. Можно сказать, что файловая модель - это модель без СУБД. Прикладные программисты разрабатывали базы данных непосредственно на внутреннем уровне (см. Рисунок 2.3), т.е. имели дело непосредственно с файлами (логический и внутренний уровень совпадали). Другими словами базы данных представляли собой наборы файлов, трактовка внутренней структуры которых принадлежала непосредственно разработчикам данной информационной системы, т.е. была уникальна. Файловая модель обладала рядом недостатков, но, несмотря на это она дожила до наших дней и иногда используется для разработки не больших однопользовательских информационных систем. Перечислим основные недостатки данной модели.

Структуру базы данных приходилось разрабатывать каждый раз при разработке информационной системы, что требовало определенных усилий и времени.

Поскольку алгоритм управления такой базой данных был полностью заложен в программном обеспечении информационной системы, то при необходимости изменить структуру данных каждый раз приходилось вносить изменения и в программное обеспечение. Кроме этого, каждый раз приходилось писать утилиты для преобразования базы данных от одной структуры к другой. Такие утилиты часто были одноразового использования. Все усложняющиеся структуры данных и алгоритмы их обработки приводили в конечном итоге к увеличению программных ошибок.

Часто даже в одной фирме создавалось несколько информационных систем (для каждого отдела, а зачастую для каждого рода деятельности), каждая из которых оперировала своими структурами данных. Бесконечной головной болью был перенос данных из одной ИС в другую, ведь структуры данных еще и периодически менялись. Так что часть программистов непрерывно писали программы преобразования данных из одного формата в другой.

Децентрализованное хранение приводила к тому, что в различных отделах приходилась дублировать одни и те же данные. Что, во-первых, требовало дополнительных ресурсов (времени и денег), а во-вторых, хранение дополнительных данных требовало и дополнительной внешней памяти. Но головная боль начиналась тогда, когда нарушалась согласованность данных об одном и том объекте, но из разных информационных систем. Для обнаружения и исправления таких ошибок требовались большие усилия.

Работа того или иного отдела требовала все новых и новых форм отчетности. Но для каждого нового отчета приходилось писать программный код, что увеличивало дополнительную нагрузку программистов. При этом, опять же после изменения структуры данных, все процедуры формирования отчетов приходилось снова переписывать.

Разные фирмы часто пользовались различными языками программирования, отличающимися друг от друга структурой создаваемых ими файлов. Возникали, т.о. дополнительные сложности совместимости форматов файлов.

Замечание

Строго говоря, файловая модель данных нельзя назвать моделью в полном смысле этого слова, так как здесь мы четко видим зависимость описания данных от таких факторов, как файловая система и программное обеспечение.

Сетевая модель

Сетевая модель относится к ранним моделям данных. Сейчас информации об этой модели данных почти не встретишь, даже такой специалист как К. Дейт при переиздании своей классической книги «Введение в системы баз данных» исключил вопросы, касающиеся сетевой и иерархической модели данных (см. [8] и [15]). Впрочем, в последнее время снова заговорили о сетевой модели в связи с распределенными информационными системами, а также с развитием объектных моделей данных.

В 1971 группа DTBG (Database Task Group) представила в американский национальный институт стандартов отчет, который послужил в дальнейшем основой для разработки сетевых систем управления базами данных. Стандарт сетевой модели впервые был определен в 1975 году организацией CODASYL (Conference of Data System Languages), которая определила базовые понятия модели и формальный язык описания.

Сетевая модель данных опирается на математическую теорию направленных графов. Базовыми элементами сетевой модели являются:

Элемент данных - минимальная информационная единица доступная пользователю.

Агрегат данных - именованная совокупность элементов данных внутри записи или другого агрегата. Агрегат бывает двух видов - агрегат типа вектор и агрегат типа повторяющаяся группа. Например, агрегат <город, улица, дом, квартира>, которому можно присвоить имя Адрес, является агрегатом типа вектор. Примером, агрегата типа повторяющаяся группа может служить агрегат <месяц, сумма> с названием Зарплата. Агрегат повторяющаяся группа характеризуется числом повторений. В данном примере это число повторений равно 12.

Запись - совокупность агрегатов или элементов данных, отражающих некоторую сущность предметной области. Например, записью будет <Фамилия, Зарплата>, где Фамилия - это элемент данных, а Зарплата - агрегат. Данную запись можно назвать Зарплата сотрудника.

Тип записей - эта совокупность подобных записей. Например, в предыдущем случае типом записи будет совокупность всех записей Зарплата сотрудника, выражающая множество сотрудников некоторого отдела. Тип записей представляет (моделирует) некоторый класс реального мира.

Набор - именованная двухуровневая иерархическая структура, которая содержит запись владельца и запись (или записи) членов. Наборы отражают связи «один ко многим» и «один к одному» между двумя типами записей. На рисунке 2.5 представлен пример набора. Здесь Отдел - запись-владелец, сотрудник - запись-член. Тип набора определяет связь между двумя типами записей. Каждый экземпляр типа набора содержит один экземпляр записи владельца и произвольное количество записей-членов (для связи типа «один ко многим»). Обратите внимание, как на рисунке 2.5 обозначается связь «один ко многим». Разветвление на конце указывает на множество экземпляров некоторого объекта. Такой способ обозначения связей мы будем использовать и далее. Среди всех наборов в сетевой модели допускается существование наборов, не имеющих владельцев. Такие наборы называются сингулярными. Владельцами сингулярных наборов формально считается система. Сингулярные наборы предназначены для доступа к экземплярам отдельных записей.

Рис. 2.5. Набор в сетевой модели данных

Резюмируя выше сказанное, будем говорить, что структура базы данных в сетевой модели задается типами записей и типами наборов.

Отметим некоторые особенности построения сетевой модели.

База данных может состоять из произвольного количества записей и наборов различных типов.

Связь между двумя записями может выражаться произвольным количеством наборов.

В любом наборе может быть только один владелец.

Тип записи может быть владельцем в одних типах наборов и членом в других типах наборов.

Тип записи может не входить ни в какой тип наборов.

Для управления сетевой базой данных используется специальный язык, который можно разбить на следующие разделы.

Язык описания данных в сетевой модели.

Описание базы данных (размещение).

Описание элементов, агрегатов и записей.

Описание наборов. данный сетевая иерархическая модель

Язык манипулирования данными.

Навигационные операции. С помощью операций навигации (группа операций FIND) двигаясь по связям можно переходить от одной текущей записи к другой. Соответственно операции модификации осуществляются над текущей записью.

Операции модификации. Операции модификации осуществляют:

Добавление новых экземпляров отдельных типов записей.

Экземпляров новых наборов.

Удаление экземпляров записей и наборов.

Модификацию отдельных составляющих внутри конкретных экземпляров записей.

Иерархическая модель.

Исторически иерархическая модель появилась раньше сетевой. Она наиболее проста из всех моделей данных. Самой известной иерархической системой позволяющей создавать иерархические базы данных является система IMS (Information Management System) фирмы IBM, используемая в свое время для поддержки лунного проекта «Аполлон». Появление иерархической модели связано с тем, что в реальном мире очень многие связи соответствуют иерархии, когда один объект выступает как родительский, а с ним может быть связано множество подчиненных объектов.

Основными информационными единицами в иерархической модели являются: база данных (БД), сегмент[2] Вместо термина «сегмент» используется также термин «запись». [2] и поле. Поле данных определяется как минимальная, неделимая единица данных, доступная пользователю с помощью СУБД. Выделяют также тип поля, представляющий собой совокупность полей одного типа. Сегмент состоит из конкретных экземпляров полей. Тип сегмента - совокупность входящих в него типов полей. Иерархическая модель представляет собой неориентированный граф, в вершинах которого располагаются сегменты (или типы сегмента). Дуги, соединяющие узлы, представляют собой связи или типы связей. Особенностью такой модели является то, что каждый сегмент может иметь не более одного предка, произвольное количество потомков и, по крайней мере, одно поле. Сегмент, который не имеет потомков, называют листовым сегментом. Иерархическое дерево начинается с одного сегмента, называемого корневым сегментом. Очень важно, что каждый сегмент должен иметь свое уникальное имя или идентификатор.

На рисунке 2.6 схематически представлена иерархическая структура. Узлы (сегменты) соединены друг с другом связующими дугами. Сегмент A является корневым сегментом. Сегменты B, E, H, J, I являются листовыми сегментами. Каждый сегмент, при этом, может содержать произвольное количество полей.

Для иерархической модели данных выделяют два языковых средства: язык описания данных и язык модификации данных. Описание базы данных предполагает описание всех ее сегментов и установление связей между ними.

Рис. 2.6. Иерархическая структура

Иерархическая модель довольно удобна для представления предметных областей, так как иерархические отношения довольно часто встречаются между сущностями реального мира. Но иерархическая модель не поддерживает отношения «многие ко многим», когда множество объектов одного типа связаны с множеством объектов другого типа. Предположим, что требуется построить модель отношения между множеством собственников жилья и множеством квартир. Если основной вопрос будет заключаться в определении того, каким жильем владеет тот или иной собственник, то естественно взять в качестве родительских узлов данные о собственнике. При этом каждый сегмент - собственник будет связан с N узлами - квартирами. Таким образом, по собственнику мы легко найдем все квартиры, которые находятся в его собственности. Однако проблема заключается в том, что у одной и той же квартиры может быть несколько собственников. Т.е. одна и та же квартира может встречаться в разных деревьях. В результате решения таких задач, как получение списка всех квартир, или получения всех собственников конкретной квартиры, будут уже не столь очевидными. Кроме того, сложной выглядит даже операция удаления из базы конкретной квартиры, поскольку для этого придется просматривать все деревья. Можно, конечно, построить параллельно деревья, в которых родительскими сегментами будут данные о квартирах, а порождаемыми сегментами - данные о владельцах, но в результате мы получим еще избыточность данных, что породит дополнительную проблему их согласованности.

Основной единицей обработки в иерархической модели является сегмент. К сегментам могут применяться такие операции как запомнить, модифицировать, удалить, извлечь, найти. Операция поиска сводится к одной из возможных процедур обхода дерева. Иерархические СУБД поддерживают, обычно, правило: никакой сегмент не может существовать без своего родителя (исключая корневой сегмент). Подобные правила, поддерживаемые СУБД, называют ограничениями целостности.

В качестве примера реально работающей иерархической модели данных можно привести устройство реестра, поддерживаемое операционными системами семейства Windows.

Реляционная модель.

Основателем реляционной модели данных является сотрудник фирмы IBM Э.Ф. Кодд. В статье «A Relation Model of Data for Large Shared Data Banks», которая вышла в 1970 году, он показал, что любое представление данных может быть сведено к совокупности двумерных таблиц, которые в математике называются отношениями (relations, отсюда термин «реляционный»).

Объектная и объектно-реляционная модели.

Объектные СУБД призваны интегрировать свойства баз данных и объектных языков программирования. В 1993 году был принять стандарт объектных баз данных ODMG-93 (ODMG это Object Database Management Group - группа управления объектными базами данных, образована в 1991 году). В последнее время ведущие производители реляционных СУБД ради повышения конкурентоспособности своих продуктов пытаются внести в них элементы объектного проектирования.

Размещено на Allbest.ru


Подобные документы

  • Базы данных и их использование в вычислительной технике. Особенности и основная конструктивная единица сетевой модели данных. Иерархическая модель, объекты предметной области. Реляционная модель, ее наглядность, представление данных в табличной форме.

    реферат [115,8 K], добавлен 19.12.2011

  • Понятие базы данных, её структура. Общие принципы хранения информации. Краткая характеристика особенностей иерархической, сетевой и реляционной модели организации данных. Structured Query Language: понятие, состав. Составление таблиц в Microsoft Access.

    лекция [202,8 K], добавлен 25.06.2013

  • Основные типичные системы управления базами данных. Способы описания взаимодействий между объектами и атрибутами. Структурная и управляющая части иерархической модели базы данных. Представление связей, операции над данными в иерархической модели.

    реферат [30,5 K], добавлен 22.02.2011

  • Характеристика сетевой модели данных и ее достоинства. Построение иерархической модель данных по принципу иерархического подчинения типов объектов, приведение ее к виду дерева введением избыточности. Реляционная модель, основанная на теории отношений.

    реферат [227,1 K], добавлен 28.11.2011

  • Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция [15,5 K], добавлен 19.08.2013

  • Классификация баз данных. Выбор системы управления базами данных для создания базы данных в сети. Быстрый доступ и получение конкретной информации по функциям. Распределение функций при работе с базой данных. Основные особенности иерархической модели.

    отчет по практике [1,2 M], добавлен 08.10.2014

  • Понятие и назначение, принципы построения и внутренняя структура системы управления базами данных, их функциональные особенности и возможности, критерии оценки эффективности. Языковые и программные средства. Использование SQL, типы и модели данных.

    презентация [677,3 K], добавлен 18.03.2015

  • Современные системы управления базами данных (СУБД). Анализ иерархической модели данных. Реляционная модель данных. Постреляционная модель данных как расширенная реляционная модель, снимающая ограничение неделимости данных, хранящихся в записях таблиц.

    научная работа [871,7 K], добавлен 08.06.2010

  • Иерархические, сетевые и реляционные модели данных. Различия между OLTP и OLAP системами. Обзор существующих систем управления базами данных. Основные приемы работы с MS Access. Система защиты базы данных, иерархия объектов. Язык программирования SQL.

    курс лекций [1,3 M], добавлен 16.12.2010

  • Понятие базы данных, модели данных. Классификация баз данных. Системы управления базами данных. Этапы, подходы к проектированию базы данных. Разработка базы данных, которая позволит автоматизировать ведение документации, необходимой для деятельности ДЮСШ.

    курсовая работа [1,7 M], добавлен 04.06.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.