Введение в теорию баз данных

Классификация систем управления и схемы архитектуры баз данных. Свойства и структурные элементы реляционных баз. Языки и среды программирования СУБД. Методы нормализации информации в таблицах. Организация локального и удаленного доступа к файлам сети.

Рубрика Программирование, компьютеры и кибернетика
Вид лекция
Язык русский
Дата добавления 02.04.2019
Размер файла 697,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Лекция

Введение в теорию баз данных

Основные понятия

Существуют различные определения понятия база данных (БД). Чаще всего под БД понимается поименованная совокупность структурированных данных, относящихся к некоторой предметной области. Однако в этом случае БД весьма трудно отличить от обычной картотеки или архива документов.

Можно выделить три свойства, которые отличают БД от простой совокупности данных:

1. БД хранится и обрабатывается в вычислительной системе.

2. Данные в БД хорошо структурированы, т.е. выделены основные элементы, их типы и связи между элементами, а также ограничения на допустимые операции.

3. Обеспечивается поиск и обработка данных.

Наиболее распространенным типом БД являются реляционные базы данных. Рассмотрим основные структурные элементы реляционной БД:

1. Поле - элементарная единица организации данных. Для описания поля используют характеристики: имя, тип, длина, точность и т.д. Соответствует столбцу в таблице.

2. Запись - совокупность логически связанных полей. Соответствует строке в таблице.

3. Собственно таблица (отношение).

Система баз данных

Система баз данных (СБД) - это компьютеризированная система структурированных данных, основная цель которой хранение информации и предоставление ее по требованию. Различают однопользовательские и многопользовательские системы.

Однопользовательская система (Single-user system) - это система, в которой в одно и то же время к БД может получить доступ только один пользователь.

Многопользовательская система (Multi-user system) - это система, в которой в каждый момент времени к БД могут получить доступ несколько пользователей. Основная задача такой системы - позволить пользователю работать с БД как с однопользовательской.

Обычно в СБД выделяют четыре основных элемента:

1. Данные.

2. Аппаратное обеспечение.

3. Программное обеспечение (ПО).

4. Пользователи.

Упрощенная схема СБД представлена на рис. 1.1.

Рис. 1.1. Элементы системы баз данных

1. Данные. Данные в БД можно охарактеризовать как интегрированные и общие. Интегрированные данные можно представить как объединение нескольких отдельных файлов, полностью или частично неперекрывающихся. В случае общих данных отдельные области данных можно использовать нескольким различным пользователям.

2. Аппаратное обеспечение. К нему относятся:

· накопители для хранения информации вместе с устройствами ввода/вывода;

· процессор вместе с основной памятью, которая используется для поддержки работы ПО системы.

3. Программное обеспечение. Основная часть ПО - это система управления базами данных, СУБД (DBMS - DataBase Management System - диспетчер БД). Основная функция СУБД - предоставление пользователю возможности работать с БД, не вникая в детали на уровне аппаратуры. СУБД поддерживает пользовательские операции высокого уровня. К таким операциям относятся и операции, выполняемые с помощью языка SQL (Structured Query Language, структурированный язык запросов) - специального языка БД. СУБД хотя и основной, но не единственный программный компонент системы, среди других можно назвать утилиты, средства разработки приложений, генераторы отчетов и другие.

4. Пользователи. Различают три группы пользователей СБД:

1. Прикладные программисты. Для целей разработки прикладных программ, которые используют базы данных, применимы различные языки и среды программирования: Visual Basic, C++, Java, C# и другие. Прикладные программы получают доступ к базе данных посредством выдачи соответствующего запроса к СУБД (обычно это операторы SQL).

2. Конечные (рядовые) пользователи. Конечный пользователь может получать доступ к базе данных, применяя одно из интерактивных приложений. Многие СУБД предоставляют не только средства для выполнения запросов SQL, но и графические утилиты, позволяющие создавать запросы без знания SQL.

3. Администраторы БД. Занимаются управлением работы сервера БД.

Организация данных в БД

В базе данных выделяют следующие элементы:

· данные;

· объекты;

· связи;

· свойства.

Данные. В БД данные обычно называют постоянными, хотя они конечно не являются таковыми в общепринятом понимании. Так их назвали в сравнении с изменчивыми данными - транзитными (промежуточные результаты, входные, выходные данные).

Входные данные - это информация, передаваемая системе с терминала или рабочей станции. Когда эта информация сохранена в таблицах, она становится частью постоянных данных или влечет за собой изменения постоянных данных.

Выходные данные - это сообщения и результаты, выдаваемые системой на экран, печать и иное устройство вывода.

Объекты. В реляционных БД это таблицы (другое название - отношения), описывающие некоторые объекты реального мира. Реляционные базы данных хранят все данные только в таблицах.

Связи. Связи отображают зависимости между объектами. Как правило, они бывают двусторонними. Допустим, есть два объекта Students и Groups, по связи между ними можно ответить на два вопроса:

1) какой группе принадлежит данный студент;

2) какие студенты входят в данную группу.

Схема, на которой представлены объекты и их связи, называется Схема объект-отношение или Диаграмма объект-отношение (рис. 1.2.).

Рис. 1.2. Связь между таблицами Students и Groups

В схеме могут быть связи, указывающие на один и тот же тип объекта. Например, преподаватель является наставником молодого преподавателя. В конкретном наборе объектов может быть любое количество связей. Между двумя таблицами может быть более одной связи.

Свойства. Все объекты и связи имеют определенные свойства. Свойства объектов выражаются полями таблицы. Свойства связей выражаются в их характеристиках при формировании.

Виды моделей данных

Ядром любой БД является модель данных. Модель данных - это совокупность структуры данных и операций их обработки. Кратко рассмотрим основные виды моделей данных и выявим их основные преимущества и недостатки, при этом будем учитывать факторы, характеризующие принципиальные особенности моделей, а также факторы, связанные с реализацией этих моделей на ЭВМ.

1. Иерархическая модель данных. Представляет собой совокупность элементов, связанных по строго определенным правилам. Объекты, связанные иерархическими отношениями образуют ориентированный граф. Основными понятиями иерархической модели данных являются: уровень, узел (или элемент) и связь. Такая модель данных обладает следующими свойствами:

· каждый узел связан только с одним вышестоящим узлом, кроме вершины;

· иерархическая модель данных имеет только одну вершину, узел не подчинен более никаким узлам;

· от каждого узла существует единственный путь к вершине;

· связь не может быть установлена между объектами, находящимися через уровень;

· связь между узлами первого уровня не определяется.

Примеры.

1) Файловая структура организации информации.

2) Структура организации (директор, заместитель, руководители отделов, сотрудники) (рис.1.3).

Рис. 1.3. Иерархическая структура данных

Преимущества:

1. Простота.

2. Минимальный расход памяти.

Недостатки:

1. Отсутствие универсальности - не всякую информацию можно выразить в иерархической модели данных.

2. Исключительно навигационный принцип доступа к данным.

3. Доступ к данным только через корневой элемент.

2. Сетевая модель данных. Элементами этой модели являются: уровень, узел, связь. Отличия в том, что элемент одного уровня может быть связан с любым количеством элементов соседнего уровня, и не существует подчиненности уровней друг другу.

Свойства сетевой модели:

· связь не может быть установлена между объектами, находящимися через уровень;

· связь между узлами первого уровня не определяется.

Пример. Рассмотрим работу над проектами: можно выделить три вида объектов - сотрудники, проекты, заказчики (рис.1.4).

Рис. 1.4. Сетевая структура данных

Преимущества:

1. Универсальность.

2. Возможность доступа к данным через значения нескольких отношений.

Недостатки:

1. Сложность - обилие понятий, вариантов их взаимосвязей и способов реализации.

2. Допустимость только навигационного принципа доступа к данным.

3. Реляционная модель данных (табличная). Это способ представления данных в виде таблиц.

Элементы: поле (столбец), запись (строка) и таблица (отношение).

В дальнейшем мы будем рассматривать именно реляционную модель данных, которая используется в реляционных системах.

Под реляционной системой понимается система, основанная на следующих принципах:

· данные пользователя представлены только в виде таблиц;

· пользователю предоставляются операторы, генерирующие новые таблицы из старых (для выборки данных).

Пример. Рассмотрим отношения Студенты и Группы:

Students:

StudentID

LastName

FirstName

MiddleName

GroupID

1

Казаков

Петр

Владимирович

1

2

Васильев

Иван

Аркадьевич

2

4

Шишкина

Дарья

Сергеевна

1

Groups:

GroupID

Supervisor

1

Царев С.М.

2

Пестов Д.Н.

Преимущества:

1. Простота. В такой модели всего одна информационная конструкция, формализующая табличное представление. Она наиболее привычна для пользователя.

2. Теоретическое обоснование. Существуют строгие методы нормализации данных в таблицах (будет подробно рассмотрено в лекциях 10-11).

3. Независимость данных. При изменении БД, ее структуры необходимы бывают лишь минимальные изменения прикладных программ.

Недостатки:

1. Низкая скорость, т.к. требуются операции соединения.

2. Большой расход памяти в силу организации всех данных в виде таблиц.

4. Система инвертированных списков - система индексов. Систему инвертированных списков можно рассматривать как частный случай сетевой модели данных, которая имеет два уровня.

Основные элементы: основной файл, инвертированный список (файл), список связей. В такой системе имеется несколько основных файлов, имеющих единую сквозную нумерацию.

Пример. Рассмотрим объекты Сотрудники и Зарплата.

Сотрудники:

Сотрудник

Должность

01 Иванов

программист

02 Сидоров

лаборант

03 Шишкин

преподаватель

04 Васильев

преподаватель

Зарплата:

Сотрудник

Дата

Сумма

05 Иванов

1.10.2008

5000

06 Сидоров

5.10.2008

7500

07 Иванов

3.12.2008

10000

08 Шишкин

3.12.2008

8000

09 Васильев

25.01.2009

5000

10 Васильев

27.01.2009

8750

Инвертированный список может быть сформирован по любому полю основных списков, в нем каждому значению сопоставляется список номеров (индексов).

Пример: инвертированный список Должность:

· программист - 01;

· лаборант - 02;

· преподаватель - 03, 04

Список связей составляется только по основным столбцам.

Пример: рассмотрим два списка связей:

· Сотрудники - Зарплата:

o 01 - 05, 07

o 02 - 06

o 03 - 08

o 04 - 09, 10

· Зарплата - Сотрудники:

o 05 - 01

o 06 - 02

o 07 - 01

o 08 - 03

o 09 - 04

o 10 - 04

Инвертированные списки являются основой для создания информационно-поисковых систем (ИПС).

В ИПС ключевые атрибуты соответствуют ключевым словам, определяющим тематику поиска.

Так как недостатки реляционной модели данных компенсируются ростом быстродействия и ресурсов современных компьютеров, то в настоящее время именно такие модели получили наибольшее распространение.

Архитектура БД

Существует архитектура БД, предложенная исследовательской группой ANSI/SPARC ANSI/SPARC (American National Standards Institute / Standards Planning and Requirements Committee - Американский национальный институт стандартов / Комитет планирования стандартов) - исследовательская группа в рамках Американского национального института стандартов. Архитектура ANSI/SPARC была предложена в 1975 году. и называется архитектурой ANSI/SPARC. Каждая система баз данных не обязана соответствовать этому определению, например, «малые» системы, весьма вероятно, не будут поддерживать все функции предложенной архитектуры. Тем не менее, рассматриваемая архитектура с достаточной точностью описывает большинство систем (и не только реляционных).

Принято выделять три уровня в архитектуре СУБД.

1. Внутренний уровень (называемый также физическим) наиболее близок к физическому хранилищу информации, т.е. связан со способами хранения информации на физических устройствах. Внутренний уровень отображает физические элементы для хранения информации. Он представляет собой бесконечное адресное пространство, из которого информация проецируется на внешние носители.

2. Внешний уровень (называемый также пользовательским) наиболее близок к пользователям, т.е. связан со способами представления данных для отдельных пользователей (прикладной программист или конечный пользователь). Для каждого пользователя может существовать свой язык СУБД. Для прикладного программиста - это язык программирования, а для конечного пользователя - это язык, основанный на меню, формах и т.д. Но все эти языки включают язык данных, встроенный в СУБД.

Для каждого отдельного пользователя может быть интересна некоторая отдельная часть БД. Такие части, с которыми работает пользователь, называются внешним представлением.

3. Концептуальный уровень (называемый также логическим) является «промежуточным» уровнем между двумя первыми. Это представление всей информации БД в более абстрактной форме. На этом уровне хранятся собственно данные, независимые от формы их представления. Концептуальное представление состоит из множества экземпляров данных. Данные здесь представлены в виде концептуальной схемы. Кроме самих данных в эту схемы могут быть включены определения дополнительных средств, например, правила обеспечения целостности.

Подробная схема архитектуры системы баз данных представлена на рис. 1.5.

Рис. 1.5. Уровни архитектуры систем баз данных

Классификация БД

Базы данных классифицируют по различным признакам, рассмотрим основные из них.

1. По технологии обработки.

· Централизованные. Хранятся в памяти одной вычислительной системы.

· Распределенные. Состоят из нескольких, возможно пересекающихся частей, хранящихся в различных узлах вычислительной сети.

2. По способу доступа к данным.

· С локальным доступом. Характеризуется тем, что к такой БД имеется доступ пользователя одной ЭВМ.

· С удаленным (сетевым) доступом. Доступно для всех пользователей сети.

3. По архитектуре.

· Файл-сервер. Предполагает выделение одной машины в сети в качестве центральной (сервер файлов), на ней хранится централизованная БД, которая используется совместно.

· Клиент-сервер. Предполагается выделение сервера БД, который кроме хранения осуществляет обработку данных. Систему БД можно рассматривать как систему, состоящую из двух частей: сервер и набор клиентов.

Сервером БД называется собственно СУБД, а клиентами - различные приложения, которые выполняются над СУБД.

4. По содержимому.

· Географические.

· Исторические.

· Научные.

· Мультимедийные.

· и т.д.

Краткие итоги

Рассмотрены основные понятия баз данных, представлены различные классификации систем управления базами данных.

Определены основные модели данных, которые используются в конкретных реализациях СУБД: иерархическая, сетевая, реляционная и система индексов. управление программирование база реляционный

Размещено на Allbest.ru


Подобные документы

  • Термины "логический" и "физический" как отражение различия аспектов представления данных. Методы доступа к записям в файлах. Структура систем управления базами данных. Отличительные особенности обработки данных, характерные для файловых систем и СУБД.

    лекция [169,7 K], добавлен 19.08.2013

  • Эволюция концепций баз данных. Требования, которым должна удовлетворять организация базы данных. Модели представления данных. Язык SQL как стандартный язык баз данных. Архитектуры баз данных. Среда Delphi как средство для разработки СУБД.

    дипломная работа [278,9 K], добавлен 26.11.2004

  • Структура и функции системы управления базами данных (СУБД). Управление хранением данных и доступом к ним. Защита и поддержка целостности данных. Надежность хранения данных во внешней памяти. Классификация СУБД по способу доступа к базе данных.

    презентация [3,7 M], добавлен 05.06.2014

  • Базы данных с двумерными файлами и реляционные системы управления базами данных (СУБД). Создание базы данных и обработка запросов к ним с помощью СУБД. Основные типы баз данных. Базовые понятия реляционных баз данных. Фундаментальные свойства отношений.

    реферат [57,1 K], добавлен 20.12.2010

  • Создание автоматизированных систем управления для предприятий нефтяной и газовой промышленности. Система управления базами данных (СУБД), ее функциональные возможности, уровневая архитектура. Характеристика реляционных, объектных и распределенных СУБД.

    курсовая работа [434,7 K], добавлен 20.07.2012

  • Система управления базой данных (СУБД), централизованное обеспечение безопасности и целостности данных, защита от несанкционированного доступа. Построение концептуальной и реляционной моделей. Процесс нормализации. Проектирование базы данных в ACCESS.

    курсовая работа [1,8 M], добавлен 29.10.2008

  • Системы управления базами данных. Состав СУБД. Языки программирования. Проектирование базы данных на СУБД MySQL. Работа с XAMPP Control Panel. База данных " Детский сад". Вывод данных из таблицы "Ребенок", "Группы", "Классы" и "Направление занятий".

    курсовая работа [1,9 M], добавлен 13.12.2016

  • Система управления базами данных как составная часть автоматизированного банка данных. Структура и функции системы управления базами данных. Классификация СУБД по способу доступа к базе данных. Язык SQL в системах управления базами данных, СУБД Microsoft.

    реферат [46,4 K], добавлен 01.11.2009

  • Определение, свойства и характеристики распределенных систем баз данных. Основная задача систем управления ими. Архитектура распределения СУБД. Сравнение технологий файлового сервера и "клиент-сервера". Стратегия распределения данных по узлам сети ЭВМ.

    курсовая работа [601,3 K], добавлен 24.05.2015

  • Виды системного программного обеспечения. Функции операционных систем. Системы управления базами данных. Классификация СУБД по способу доступа к базе данных. Инструментальные системы программирования, обеспечивающие создание новых программ на компьютере.

    реферат [22,1 K], добавлен 27.04.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.