Хранилища данных

Хранилище данных как центр, где собирается вся необходимая информация. Рассмотрение основного принципа действия Data Warehouse. Главные преимущества хранилищ данных: стабильность, интегрированность. Анализ современной индустрии программных средств.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 21.07.2012
Размер файла 59,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

хранилище данный программный информация

Данная курсовая работа будет рассматривать вопрос хранилищ данных - одной из самых распространенных систем баз данных. Так как данная система широко используется для ведения баз данных в различных областях человеческой деятельности, то вопрос ее администрирования весьма актуален.

На сегодняшний день существует масса источников информации об хранилище данных - это книги и видео лекции, электронные учебники, и множество статей помогающих в освоении этого нелегкого дела сопровождения и администрирования хранилище данных.

Хранилище данных (Data Warehouse) по сути, представляет собой центр, в который собирается вся необходимая информация из различных подразделений предприятия. Прежде чем попасть в хранилище, данные должны быть соответствующим образом обработаны. Базы данных, в которых происходит накопление, обработка первичных данных, на основании которых строится хранилище, будем далее называть транзакционными. Разные отделы могут использовать неодинаковые системы обработки со своими транзакционными базами данных. Соответственно, прежде чем использовать эти разрозненные данные, их нужно проанализировать. Этот процесс занимает весьма длительный период в процессе подготовки к созданию хранилища.

Объектом моего исследования являются методы системного анализа интегрированной методологии разработки информационных систем. В хранилище данных включены, средства повышения быстродействия и доступности, позволяющие распределить нагрузку и обеспечить бесперебойную работу, функции для улучшения управления и настройки, снижающие совокупную стоимость владения. Кроме того, хранилище данных полностью использует все возможности операционной системы Windows и другие операционных систем.

Предметом моего исследования является программное обеспечение, скрепляющее различные звенья хранилища данных и делающее возможным его построение как единого целого. При построении хранилища данных важную роль играют программные средства извлечения, преобразования и очистки данных. Предметом концепции хранилища данных служат сами данные, то есть целью здесь являются не способы описания и отображения объектов предметной области, а собственно данные как самостоятельный объект предметной области, порожденной в результате функционирования ранее созданных информационных систем.

Цель курсовой работы состоит в изучении сущности, состава и значения хранилища данных, структуры и области их применения, накоплении, передаче и хранении данных, информации и знаний в интересах общественной индустрии.

В курсовой работе определены основные задачи, которые необходимо решить в данной работе:

1) Дать понятие хранилища;

2) Рассмотреть типичную структуру хранилища данных;

3) Создание информационно-аналитических систем;

4) Проанализировать области применения их в практике.

При подготовке и написании курсовой работы мной были использованы учебники по информатике, информационным системам и программированию как зарубежных, так и наших российских авторов.

Задача, которая встает перед администратором или разработчиком, это проектирование структуры хранилища данных. Неверно спроектированное хранилище данных впоследствии доставит много хлопот, как администратору, так и программистам и пользователям. Поэтому необходимо ответственно отнестись к разработке хранилища данных, сразу же продумывая различные варианты использования данных.

Методами исследования при создании данной курсовой являлись, как сама практика работы хранилища данных, так и изучение источников информации, которыми стали статьи по хранилищу данных взятые с различных электронных ресурсов, а так же книги и учебники, посвященные изучению аспектов администрирования различными авторами которые имели определенный опыт и знания в этой области.

Практическая значимость работы заключается в возможности использования курсовой для краткого ознакомления с хранилищем данных и способов ее администрирования.

1.Понятия хранилища данных

1.1 Типичная структура хранилищ данных

Информационные системы масштаба предприятия, как правило, содержат приложения, предназначенные для комплексного многомерного анализа данных, их динамики, тенденций и тому подобное. Такой анализ в конечном итоге призван содействовать принятию решений. Нередко эти системы так и называются - системы поддержки принятия решений.

Принять любое управленческое решение, невозможно не обладая необходимой для этого информацией, обычно количественной. Для этого необходимо создание хранилищ данных (Data warehouses), то есть процесс сбора, отсеивания и предварительной обработки данных с целью предоставления результирующей информации пользователям для статистического анализа. А нередко и создания аналитических отчетов.

Концепция Data warehouses была предложена в 1990 г. Б. Инмоном и стала одной из доминирующих в разработке информационных технологий обработки данных 90 - х годов. Появление этой концепции было следствием неявного осознания того факта, что существует два основных функционально различных класса систем обработки информации.

Первый базируется на обработке текущего потока транзакций и предоставляет текущий или охватывающий небольшой временной период снимок информации.

Второй основан на сборе и подготовке большого по объему и временному периоду массива значимой информации, предназначенного для проведения анализа данных. Развитие концепции Data warehouses позволило провести границы между этими двумя типами систем. В русском языке термин "Data Warehouse" переводится как хранилище данных или как информационное хранилище. Однако термин "Information warehouse" был введен корпорацией IBM в начале 80 - х годов и, по утверждению ее специалистов, означает нечто большее, чем Data warehouses.

Поэтому целесообразно пользоваться общепринятым термином "хранилище данных", хотя он несколько хуже передает суть концепции.

Согласно классическому определению Б. Инмона, Data Warehouse есть предметно ориентированный, интегрированный, неизменный, поддерживающий хронологию набор данных, предназначенный для поддержки принятия решений. Следует отметить, что в этом определении соединены две различные функции:

Собственно анализ как элемент принятия решений. Принятие решений в качестве сферы применения Data Warehouse существенно сужает определение. Если в определении оставить лишь анализ как элемент научных, технологических и экологических систем, круг использования данной концепции может быть значительно расширен.

Очень важен основной принцип действия Data Warehouse:

Единожды занесенные в Data Warehouse данные затем многократно извлекаются из него и используются для анализа. Отсюда вытекает одно из основных преимуществ использования Data Warehouse в работе предприятия - контроль за критически важной информацией, полученной из различных источников, как за производственным ресурсом.

Отметим, что наиболее уязвимым местом использования Data Warehouse на предприятии, с точки зрения бизнеса, является корректность его данных, полученных из разных источников. Данные перед загрузкой в Data Warehouse должны быть либо "очищены от шума", либо обработаны методами нечеткой логики, допускающей наличие противоречивых фактов. Например, данные о предприятии - партнере могут быть получены от разных экспертов, чьи оценки порой бывают противоположными.

К примеру, Ральф Кимбалл, один из авторов концепции хранилищ данных, описывал хранилище данных как "место, где люди могут получить доступ к своим данным".

- Он же сформулировал и основные требования к хранилищам данных:

- Поддержка высокой скорости получения данных из хранилища;

- Поддержка внутренней непротиворечивости данных;

- Возможность получения и сравнения так называемых срезов данных;

- Наличие удобных утилит просмотра данных в хранилище;

- Полнота и достоверность хранимых данных;

- Поддержка качественного процесса пополнения данных.

Удовлетворять всем перечисленным требованиям в рамках одного и того же продукта зачастую не удается. Поэтому для реализации хранилищ данных обычно используется несколько продуктов, одни из которых представляют собой собственно средства хранения данных, другие - средства их извлечения и просмотра, третьи - средства их пополнения и так далее.

Хранилище данных представляет собой банк данных определенной структуры, содержащий информацию о производственном процессе компании в историческом контексте. Главное назначение хранилища - обеспечивать быстрое выполнение произвольных аналитических запросов.

Типичное хранилище данных, как правило, отличается от обычной реляционной базы данных. Во-первых, обычные базы данных предназначены для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища данных предназначены для принятия решений. Например, продажа товара и выписка счета производятся с использованием базы данных, предназначенной для обработки транзакций, а анализ динамики продаж за несколько лет, позволяющий спланировать работу с поставщиками, с помощью хранилища данных.

Во-вторых, обычные базы данных подвержены постоянным изменениям в процессе работы пользователей, а хранилище данных относительно стабильно:

Данные в нем обычно обновляются согласно расписанию. Например, еженедельно, ежедневно или ежечасно в зависимости от потребностей. В идеале процесс пополнения представляет собой просто добавление новых данных за определенный период времени без изменения прежней информации, уже находящейся в хранилище.

Ну и, наконец, в-третьих, обычные базы данных чаще всего являются источником данных, попадающих в хранилище. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов.

Специфика работы аналитических систем делает практически невозможным их прямое использование на оперативных данных. Это объясняется различными причинами, в том числе разрозненностью данных, хранением их в форматах различных Систем управления баз данных и в разных уголках корпоративной сети, но, что наиболее важно, неприменимостью структур данных оперативных систем для выполнения задач анализа. Для этих целей и создается хранилище данных.

Согласно всемирным исследованиям компаний, многие компании активно применяют хранилища данных, чтобы добиться преимущества в конкурентной борьбе и получить значительно большую отдачу от своих инвестиций.

Перечислим главные преимущества хранилищ данных:

- Единый источник информации: Компания получает выверенную единую информационную среду, на которой будут строиться все справочно - аналитические приложения в той предметной области, по которой построено хранилище. Эта среда будет обладать единым интерфейсом, унифицированными структурами хранения, общими справочниками и другими корпоративными стандартами, что облегчает создание и поддержку аналитических систем. Также, при проектировании информационного хранилища данных особое внимание уделяют достоверности информации, которая попадает в хранилище.

- Производительность: Физические структуры хранилища данных специальным образом оптимизированы для выполнения абсолютно произвольных выборок, что позволяет строить действительно быстрые и качественные системы запросов, а согласитесь это весьма выгодно.

- Быстрота разработки: Специфическая логическая организация хранилища и существующее специализированное программное обеспечение позволяют создавать аналитические системы с минимальными затратами на программирование.

- Интегрированность: Интеграция данных из разных источников уже сделана, поэтому не надо каждый раз производить соединение данных для запросов, требующих информацию из нескольких источников. Под интеграцией понимается не только совместное физическое хранение данных, но и их предметное, согласованное объединение, очистку и выверку при их формировании, соблюдение технологических особенностей и так далее.

- Историчность и стабильность: OLTP - Системы оперируют с актуальными данными, срок применения и хранения которых обычно не превышает величины текущего бизнес - периода, в то время как информационное хранилище данных нацелено на долговременное хранение информации в течение 10 - 15 лет. Стабильность означает, что фактическая информация в хранилище данных не обновляется и не удаляется, а только специальным образом адаптируется к изменениям бизнес - атрибутов. Таким образом, появляется возможность осуществлять исторический анализ информации.

- Независимость: Выделенность информационного хранилища существенно снижает нагрузку на OLTP-Системы со стороны аналитических приложений, тем самым производительность существующих систем не ухудшается, а на практике происходит уменьшение времени отклика и улучшение доступности систем.

1.2 Таблицы измерений

Таблицы измерений содержат неизменяемые либо редко изменяемые данные. В подавляющем большинстве случаев эти данные представляют собой по одной записи для каждого члена нижнего уровня иерархии в измерении. Таблицы измерений также содержат как минимум одно описательное поле, обычно с именем члена измерения и, как правило, целочисленное ключевое поле, обычно это суррогатный ключ для однозначной идентификации члена измерения. Если будущее измерение, основанное на данной таблице измерений, содержит иерархию, то таблица измерений также может содержать поля, указывающие на "родителя" данного члена в этой иерархии.

Нередко таблица измерений может содержать и поля, указывающие на "прародителей", и иных "предков" в данной иерархии - это обычно характерно для сбалансированных иерархий, а также дополнительные атрибуты членов измерений, содержавшиеся в исходной оперативной базе данных. Например, адреса и телефоны клиентов.

Каждая таблица измерений должна находиться в отношении "один ко многим" с таблицей фактов.

Отмечу, что скорость роста таблиц измерений должна быть незначительной по сравнению со скоростью роста таблицы фактов! Например, добавление новой записи в таблицу измерений, характеризующую товары, производится только при появлении нового товара, не продававшегося ранее.

Одно измерение куба может содержаться как в одной таблице (в том числе и при наличии нескольких уровней иерархии), так и в нескольких связанных таблицах, соответствующих различным уровням иерархии в измерении. Если каждое измерение содержится в одной таблице, такая схема хранилища данных носит название "звезда" (Star schema).

Если же хотя бы одно измерение содержится в нескольких связанных таблицах, такая схема хранилища данных носит название "снежинка" (Snowflake schema).

Дополнительные таблицы измерений в такой схеме, обычно соответствующие верхним уровням иерархии измерения и находящиеся в соотношении "один ко многим" в главной таблице измерений, соответствующей нижнему уровню иерархии, иногда называют консольными таблицами (Outrigger table).

Так же стоит отметить, что даже при наличии иерархических измерений с целью повышения скорости выполнения запросов к хранилищу данных нередко предпочтение отдается схеме "звезда"

Хотя, однако, не все хранилища данных проектируются по двум приведенным выше схемам. Так, довольно часто вместо ключевого поля для измерения, содержащего данные типа "дата", и соответствующей таблицы измерений сама таблица фактов может содержать ключевое поле типа "дата". В этом случае соответствующая таблица измерений просто отсутствует.

Еще один пример отступления от правил - наличие нескольких разных иерархий для одного и того же измерения. Типичные примеры таких иерархий - иерархии для календарного и финансового года при условии, что финансовый год начинается не с 1 января, или с различными способами группировки членов измерения. Например, группировать товары можно по категориям, а можно и по компаниям - поставщикам. В этом случае таблица измерений содержит поля для всех возможных иерархий с одними и теми же членами нижнего уровня, но с разными членами верхних уровней.

Как отмечено выше, таблица измерений может содержать поля, не имеющие отношения к иерархиям и представляющие собой просто дополнительные атрибуты членов измерений. Иногда такие атрибуты могут быть использованы при анализе данных.

Следует отметить, что для создания реляционных хранилищ данных нередко применяются специализированные системы для управления базами данных, хранение данных в которых оптимизировано с точки зрения скорости выполнения запросов. Примером такого продукта является Sybase Adaptive Server IQ, реализующий нетрадиционный способ хранения данных в таблицах не по строкам, а по столбцам. Однако создавать хранилища можно и в обычных реляционных систем управления баз данных.

2.Аналитические системы

2.1 Создание информационно - аналитических систем

Основой современной индустрии программных средств и решающим фактором успеха при создании информационно - аналитических систем является технология их создания.

Информационно - аналитические системы - это особый класс информационных систем, предназначенных для аналитической обработки данных, а не для автоматизации повседневной деятельности организации. Информационно - аналитические системы объединяют, анализируют и хранят как единое целое информацию, извлекаемую как из учетных баз данных организации, так и из внешних источников. Входящие в состав информационно - аналитических систем хранилища данных обеспечивают преобразование больших объемов сильно детализированных данных в обобщенную выверенную информацию, которая пригодна для принятия обоснованных решений. В отличие от обычных баз данных хранилища содержат обработанное, упорядоченное и понятное руководителям представление данных. Хранилище данных является сборочным конвейером по подготовке информации в интегрированном, непротиворечивом, наглядном виде для поддержки принятия управленческих решений.

Создание информационно - аналитических систем, реально отвечающих целям и задачам организаций, представляет собой достаточно сложный процесс, включающий этапы формирования концепции, проектирования, разработки, внедрения и сопровождения.

Сам характер этого процесса требует предварительной разработки достаточно жесткой фиксированной технологической схемы. Технологическая схема представляет собой в соответствии со стандартом ГОСТ Р ИСО/МЭК 12207 - 99, описывающим процессы жизненного цикла программных средств, последовательность работ и задач, выполняемых определенными исполнителями.

Таким образом, необходима общая методика создания информационно - аналитических систем, содержащая состав и последовательность работ и задач, состав ролевых функций и порождаемых артефактов, таких как документов моделей и прочее...

Технология и методика создания информационно - аналитических систем охватывает следующие виды деятельности:

1) Сбор, анализ и детализацию требований к информационно - аналитической системе, определение приоритетов реализации этих требований и постановка задач по их реализации, определение требований по архитектуре, надежности и защите от несанкционированного доступа и определение состава данных;

2) Разработка проектных решений по всем аспектам построения информационно-аналитической системы, определение состава источников информации, способов передачи и очистки данных, состава приложений организации доступа к данным, проектирование архитектуры, проектирование баз данных;

3) Разработка аналитических приложений, выбор и настройка инструментальных средств, сбора, преобразования и очистки данных и организации доступа пользователей к данным, разработка метаданных, тестирование, разработка документации пользователей.

Рекомендации по выполнению работ и задач включают рекомендации по вопросам сбора требований, идентификации источников данных, извлечения и преобразования данных для размещения в хранилище, создания тематических витрин данных, разработки регламентных отчетов, применения средств углубленного анализа данных, вопросы хранения "исторических" данных.

Создание единого информационного пространства для управления ресурсами требует согласованного ведения систем оперативного учета на основе общих справочников, составляющих основу корпоративных хранилищ данных. При этом согласованность может обеспечиваться или непосредственным использованием в процессе загрузки информации справочных классификаторов, взятых из хранилища данных, или вводом уникальных в рамках всей системы идентификаторов, на которые в хранилище имеются соответствующие справочники. Например, обще статистические коды, социальный номер физического лица и тому подобное. Перечислим самые существенные проблемы, которые должны быть решены для успешного ведения интегрированных хранилищ по ресурсам:

- При определении адресных сведений следует придерживаться следующей структуры адреса: Почтовый индекс, код населенного пункта по обще статистическому классификатору ОКАТО, код улицы, номер дома, номер корпуса/строения, номер квартиры/помещения. Классификаторы улиц в настоящее время разрабатываются администрациями городов и должны интегрироваться на сервере областной администрации в едином адресаторе. Возможно, использовать в качестве основы такого адресатора базу областной налоговой инспекции. Вместе с тем, правомерно областной адресатор курировать управлению архитектуры в рамках ведения градостроительного кадастра совместно с информационно - аналитическим центром областной администрации и распространять всем заинтересованным ведомствам для ведения своих реестров.

- Необходимо стремиться к соблюдению однозначной идентификации юридических и физических лиц в системе. В частности, информация по юридическому лицу или частному предпринимателю должна сопровождаться кодом индивидуального налогового номера. По физическому лицу предпочтительно иметь уникальный социальный номер, который может быть присвоен либо управлением внутренних дел на основе базы данных областного адресного бюро, либо налоговой инспекцией. В связи с отсутствием в области однозначной идентификации физических лиц по ним в базе необходимо иметь номер и серию документа удостоверяющего личность, дату и наименование органа, выдавшего документ.

- Желательно иметь на уровне области интегрированные хранилища сведений по юридическим и физическим лицам, определенная информация из которых может быть использована различными ведомствами в качестве соответствующих общесистемных справочников. Так на уровне информационно - аналитического центра администрации области должна вестись интегрированная база по юридическим лицам, которая объединяет сведения, собираемые регистрирующими органами администраций городов и районов, а также ряд вышеупомянутых ведомственных реестров. В настоящее время в администрациях крупных городов уже ведутся соответствующие базы данных, которые могут быть использованы в интересах ведения общего хранилища. Недостающую информацию можно получить из реестра областного комитета статистики. Уточнять информацию можно на основе открытых для публикации сведений реестра налогоплательщиков областной налоговой инспекции. Хранилище сведений по физическим лицам должно вестись на основе данных адресного бюро управления внутренних дел, а также областного отдела ЗАГС и, возможно, областной налоговой инспекции.

- Все сведения, которые могут быть сведены к перечислимому типу следует кодировать в системе на основе внутренних справочников. Так, например, при описании конструктивных элементов зданий таких как, материал и форма фундаментов, материал стен и перегородок, материал перекрытий, материал и тип крыши, материал проемов, внутренние санитарно-технические работы и электротехнические устройства следует пользоваться внутрисистемными справочниками.

- Каждое зарегистрированное строение и помещение должно иметь уникальный в рамках области кадастровый номер, который будет однозначно идентифицировать его в региональной информационной системе, аналогично коду юридического лица или социальному номеру физического лица. По соответствующему инвентарному номеру в хранилище будет накапливаться динамика состояния объекта собственности. Аналогичным образом должны быть идентифицированы все ресурсы области.

- Каждая запись ведомственной базы данных в системе оперативной обработки информации должна сопровождаться служебной датой ее актуализации и признаком первичного ввода, корректировки сведений или прекращения существования. Эти сведения необходимы для обеспечения возможности последующего использования информации на уровне областных хранилищ.

2.2 Области применения

Аналитические системы поддержки и принятия решений позволяют решать три основных задачи:

1) Ведение отчётности;

2) Анализ информации в реальном времени (OLAP);

3) Интеллектуальный анализ данных.

Сервис отчётности систем поддержки и принятия решений помогает организациям справиться с созданием всевозможных информационных отчетов, справок, документов, сводных ведомостей, особенно когда число выпускаемых отчетов велико и формы отчётов часто меняются. Средства системы поддержки и принятия решений, автоматизируя выпуск отчётов, позволяют перевести их хранение в электронный вид и распространять по корпоративной сети между служащими компании.

Технология комплексного многомерного анализа данных получила название OLAP (On - Line Analytical Processing). OLAP - это ключевой компонент организации хранилищ данных. Концепция OLAP была описана в 1993 году Эдгаром Коддом, известным исследователем баз данных и автором реляционной модели данных. В 1995 году на основе требований, изложенных Коддом, был сформулирован так называемый тест FASMI (Fast Analysis of Shared Multidimensional Information - быстрый анализ разделяемой многомерной информации), включающий следующие требования к приложениям для многомерного анализа:

- Предоставление пользователю результатов анализа за приемлемое время, пусть даже ценой менее детального анализа;

- Возможность осуществления любого логического и статистического анализа, характерного для данного приложения, и его сохранения в доступном для конечного пользователя виде;

- Многопользовательский доступ к данным с поддержкой соответствующих механизмов блокировок и средств авторизованного доступа;

- Многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий это - ключевое требование OLAP;

- Возможность обращаться к любой нужной информации независимо от ее объема и места хранения.

Следует отметить, что OLAP - Функциональность может быть реализована различными способами, начиная с простейших средств анализа данных в офисных приложениях и заканчивая распределенными аналитическими системами, основанными на серверных продуктах.

Сам OLAP - Сервис представляет собой инструмент для анализа больших объемов данных в режиме реального времени. Взаимодействуя с OLAP - Системой, пользователь сможет осуществлять гибкий просмотр информации, получать произвольные срезы данных, и выполнять аналитические операции детализации, свертки, сквозного распределения, сравнения во времени. Вся работа с OLAP - Системой происходит в терминах предметной области.

Так же OLAP - Системы являются частью более общего понятия Business Intelligence, которое включает в себя помимо традиционного OLAP - Сервиса средства организации совместного использования документов, возникающих в процессе работы пользователей хранилища. Технология Business Intelligence обеспечивает электронный обмен отчетными документами, разграничение прав пользователей, доступ к аналитической информации из Интернета или локальной сети.

При помощи средств добычи данных можно проводить глубокие исследования данных. Эти исследования включают в себя:

- Поиск зависимостей между данными, Например "Верно ли, что рост продаж продукта А обусловлен ростом продаж продукта В?";

- Выявление устойчивых бизнес - групп. Например "Какие группы клиентов, близких по поведенческим и другим характеристикам, можно выделить? Какие характеристики клиентов при этом оказывают наибольшее влияние на классификацию?";

- Прогнозирование поведения бизнес - показателей. Например "Какой объем перевозок ожидается в следующем месяце?";

- Оценка влияния решений на бизнес компании. Например "Как изменится спрос на товар А среди группы потребителей Б, если снизить цену на товар С?";

- Поиск аномалий. Например "С какими сегментами клиентской базы связаны наиболее высокие риски?".

Телекоммуникационные компании используют системы поддержки принятия решений, а следовательно и хранилища данных, для подготовки и принятия комплекса решений, направленных на сохранение своих клиентов и минимизацию их оттока в другие компании. Системы поддержки и принятия решений позволяют компаниям более результативно проводить свои маркетинговые программы, вести более привлекательную тарификацию своих услуг.

Анализ записей с характеристиками вызовов позволяет выявлять категории клиентов с похожими стереотипами поведения, с тем, чтобы дифференцировано подходить к привлечению клиентов той или иной категории.

Есть категории клиентов, которые постоянно меняют провайдеров, реагируя на те или иные рекламные компании. Системы поддержки и принятия решений позволяют выявить наиболее характерные признаки "стабильных" клиентов, то есть клиентов, длительное время остающихся верными одной компании, давая возможность ориентировать свою маркетинговую политику на удержание именно этой категории клиентов.

Так же системы поддержки и принятия решений используются для более качественного мониторинга различных аспектов банковской деятельности, таких как обслуживание кредитных карт, займов, инвестиций и так далее, что позволяет значительно повысить эффективность работы.

Выявление случаев мошенничества, оценка риска кредитования, прогнозирование изменений клиентуры - так же являются областями применения, систем поддержки принятия решений и методов добычи данных. Классификация клиентов, выделение групп клиентов со сходными потребностями позволяет проводить целенаправленную маркетинговую политику, предоставляя более привлекательные наборы услуг той или иной категории клиентов.

Например, многие компании, специализирующиеся в области разработки аналитических и управленческих систем для банков, коммерческих и производственных предприятий, бюджетных организаций, проводят так называемые демо - дни на тему "Постановка и автоматизация бюджетирования в холдингах и финансово-промышленных группах".

Сама тема демо - дня была выбрана неслучайно. На сегодняшний день все больше предприятий и компаний ощущают потребность в инструменте, с помощью которого можно четко определить возможности и перспективы развития компании, повысить финансовую обоснованность и ответственность за принимаемые управленческие решения.

Достаточно сказать, что эффективные управленческие технологии позволяют сократить потребность в оборотных средствах примерно на 10 - 30%. Поэтому понятен и закономерен интерес к программной разработке компании Intersoft Lab - управленческой системе "Контур Корпорация. Бюджет холдинга", созданной на основе платформы интеллектуального анализа данных "Контур". Система позволяет планировать бюджетные показатели финансово - хозяйственной деятельности предприятий холдинга, учитывать, контролировать и анализировать фактическое исполнение бюджетов. Первым шагом к знакомству с программным продуктом стало определение целей и задач внедрения бюджетного управления в холдингах и финансово - промышленных группах.

Участники семинара познакомились с принципами постановки бюджетного управления в многофилиальной компании и подробно рассмотрели организационные, методические и технологические аспекты внедрения автоматизированной системы бюджетирования на предприятии. Специалисты компании Intersoft Lab подробно остановились на функциональных и технических возможностях программного комплекса "Контур Корпорация. Бюджет холдинга". Практическое применение системы было продемонстрировано на примере технологии ведения бюджета движения денежных средств. Многочисленные вопросы слушателей касались, в частности, автоматизации бюджетирования на предприятии. Большой интерес вызвало обсуждение методов "раскраски" бюджетов. Для разметки бюджетных данных аналитическими признаками существует три основных способа:

1) Настройка бюджетной аналитики и разметка бюджетных данных в учетной системе;

2) Автоматическая разметка данных в ходе загрузки на основании автоматизированных запрограммированных алгоритмов разметки;

3) Разметка вручную в интерфейсе системы.

Все эти способы разметки данных поддерживаются в автоматизированной системе "Контур Корпорация. Бюджет холдинга".

Заключение

Для развития и процветания бизнеса недостаточно просто владеть информацией, все зависит от качества владения - умения четко и быстро определять категорию показателей, на основании которых требуется принимать решение, проводить анализ определенных значений данных показателей с различной степенью детализации с учетом всех параметров, оказывающих на них влияние.

Хранилище данных является хорошим инструментом в решении данной задачи. Тот, у кого есть средства, позволяющие четко представить картину бизнес - данных, их взаимосвязь, историю возникновения, временную глубину, оказывается в выигрыше. Он может отследить тенденции развития, спрогнозировать возможные изменения, и, соответственно, получить конкурентные преимущества. Качественная визуализация данных, ориентированных на различные группы работников и отделы - одна из основных задач, решаемых с помощью хранилища данных.

Хранилище предоставляет возможность получения каждым подразделением данных в разрезе интересующих его показателей, в удобном и привычном для сотрудников этого подразделения виде. Можно сравнить хранилище с огромным складом с большим ассортиментом продукции, а информацию по подразделениям, получаемых из него, с небольшими специализированными отделами, где собрана соответствующая категория товаров. Такого рода специализированные представления информации, часто называют витринами данных. Создание хранилища данных и соответствующей инфраструктуры начинается с тщательного планирования и определения сроков работ. Первое - как уже говорилось выше - надо четко определить цели визуализации данных. Должна быть проанализирована отчетность компании. Целесообразно разбить отчетность на обязательную, предоставляемую в контролирующие органы и внутрикорпоративную. Далее идет разделение по срокам ежедневная, ежемесячная, ежеквартальная и так далее. Внутрикорпоративная информация также разделяется по отделам и подразделам для создания витрин данных. Уже на этом этапе нужно выявить и избавиться по возможности от дублирования отчетности.

Итак, в рассмотренной теме курсовой работы можно выделить следующие особенности:

1) Хранилища данных (Data warehouses) представляют собой предметно ориентированный, интегрированный, неизменный, поддерживающий хронологию набор данных, предназначенный для поддержки принятия решений;

2) Главное назначение хранилища - обеспечивать быстрое выполнение произвольных аналитических запросов;

3) Основными составляющими структуры хранилищ данных являются таблица фактов (Fact table) и таблицы измерений (Dimension tables);

4) Аналитические системы поддержки и принятия решений позволяют решать три основных задачи:

1) Ведение отчётности;

2) Анализ информации в реальном времени (OLAP);

3) Интеллектуальный анализ данных.

При помощи средств добычи данных можно проводить глубокие исследования данных. Эти исследования включают в себя:

- Поиск зависимостей между данными;

- Выявление устойчивых бизнес - групп;

- Прогнозирование поведения бизнес - показателей;

- Оценка влияния решений на бизнес компании;

- Поиск аномалий.

5) Областью применения хранилища данных являются следующие отрасли экономики:

- Телекоммуникации;

- Страхование;

- Банковское дело;

- Розничная торговля.

Ну и еще одна не менее важная задача - это обеспечение безопасности. Каким образом распределить доступ к хранилищу, как организовать защиту от сбоев - вот вопросы, которые обязательно надо планировать и разрешать. Широко распространен способ предоставления полномочий и использование данных в хранилище на ролевой основе, когда пользователю или группе пользователей назначается определенная роль, согласно которой определяется возможность доступа к определенным группам данных, причем уровнем детализации предоставляемых данных можно весьма гибко варьировать.

Рынок хранилищ данных сейчас находится в стадии роста. Через некоторое время нам следует ожидать серьезного увеличения спроса на хранилища данных в крупных и средних российских компаниях. Соответственно, потребуется переход на современные средства построения, наполнения и использования хранилищ данных.

Список использованных источников

1.Волков О.И. Экономика предприятия.

2.Кривко О.Б. Информационные технологии.

3.Маклаков С. Хранилища данных и их проектирование с помощью CA ERwin

4.Туманов В.Е. Проектирование хранилищ данных для систем бизнес - аналитики. Учебное пособие

5.Туманов В. Е., Маклаков С. В. Проектирование реляционных хранилищ данных

6.Аносова H. П. Бородин O. O. Гаврилов E. C. Марасанов A. M. Распределенные базы и хранилища данных

7.Паклин Н.Б., Орешков В.И. Бизнес-аналитика: От данных к знаниям

8.Спирли Э. Корпоративные хранилища данных

9.Барсегян А.А., Куприянов М.С., Степаненко В.В. и др. Методы и модели анализа данных: OLAP и Data Mining

10.Хомоненко А.Д. Базы данных

Размещено на Allbest.ru


Подобные документы

  • Понимание хранилища данных, его ключевые особенности. Основные типы хранилищ данных. Главные неудобства размерного подхода. Обработка информации, аналитическая обработка и добыча данных. Интерактивная аналитическая обработка данных в реальном времени.

    реферат [849,7 K], добавлен 16.12.2016

  • Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.

    реферат [1,3 M], добавлен 25.03.2013

  • Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция [15,5 K], добавлен 19.08.2013

  • Определение многомерной модели данных для удовлетворения основных информационных потребностей предприятия. Экстракция, загрузка и перенос данных из различных источников данных. Разработка собственных ETL–систем. Оптимизация работы хранилища данных.

    презентация [9,1 M], добавлен 25.09.2013

  • Методы построения хранилища данных на основе информационной системы реального коммерческого предприятия. Основные аналитические задачи, для решения которых планируется внедрение хранилищ данных. Загрузка процессоров на серверах. Схемы хранения данных.

    контрольная работа [401,0 K], добавлен 31.05.2013

  • Понятие и функциональное назначение информационного хранилища, свойства и компоненты. Проблемы интеграции данных, принципы организации хранилищ. Проектирование и анализ реляционной базы данных "Салона красоты" методом нормальных форм и "сущность-связь".

    курсовая работа [573,5 K], добавлен 21.02.2015

  • Предпосылки появления облачных технологий. Сущность понятия "облачное хранилище данных", главные преимущества и недостатки. Главное достоинство Google. SugarSync: понятие, синхронизация любых папок на диске. Сравнительный анализ общедоступных сервисов.

    курсовая работа [250,8 K], добавлен 31.03.2014

  • Принципы построения и основные компоненты хранилищ данных, общая характеристика основных требований к ним по Р. Кинболлу. Понятие и виды баз данных. Методика проектирования комплекса задач автоматизации учета по счету 02 "Амортизация основных средств".

    контрольная работа [27,8 K], добавлен 12.11.2010

  • Рассмотрение OLAP-средств: классификация витрин и хранилищ информации, понятие куба данных. Архитектура системы поддержки принятия решений. Программная реализация системы "Abitura". Создание Web-отчета с использованием технологий Reporting Services.

    курсовая работа [2,7 M], добавлен 05.12.2012

  • Анализ деятельности маркетингового агентства. Типы программного обеспечения, которые используются при реализации хранилищ данных. Концептуальная модель – описание предметной области, для которой создается хранилище, ее сущностей и связей между ними.

    дипломная работа [1,6 M], добавлен 10.09.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.