Применение настройки "Анализ данных" и статистических функций для анализа данных

Метод Data Mining (извлечения знаний из баз данных). Структуризация и первичная логическая обработка данных. Анализ и прогнозирование статистической обработки данных. Проведение финансово-экономических расчетов. Решение уравнений и оптимизационных задач.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 17.10.2011
Размер файла 120,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Реферат

по дисциплине

Информационные аналитические системы.

На тему: «Применение настройки «Анализ данных» и статистических функций для анализа данных»

Содержание

  • Введение
  • Data Mining
  • Надстройка "Пакет анализа"
    • Структуризация и первичная логическая обработка данных
    • Статистическая обработка данных, анализ и прогнозирование
    • Проведение финансово-экономических расчетов
    • Поиск решения
      • Диспетчер сценариев «что - если»
  • Список литературы

Введение

В связи с огромными потоками информации в современном мире появляется потребность в информационных технологиях, которые помогут справиться с этим потоком разнородной информации, найти в ней тенденции и закономерности, скрытые от поверхностного взгляда. Методы традиционной математической статистки уже не могут удовлетворить потребности современных аналитиков. Общество пришло к пониманию, что многогигабайтные архивы данных могут принести значительно больше знаний, чем среднее значение по показателю.

В связи с этим широкое применение получила методика Knowledge Discovery in Databases - извлечение знаний из баз данных. KDD представляет собой последовательность действий, которые нужно выполнить для получения знаний. Ядром KDD является технология Data Mining в дословном переводе «раскопка данных».

Data Mining применяется во всех отраслях, где есть данные. Но лидером являются коммерческие предприятия. В частности, в розничной торговле решают задачи прогнозирования спроса, анализа потребительской корзины, стимулирования продаж. Банки используют технологии Data Mining для сегментации клиентов с целью проведения кредитной политики. В телекоммуникациях решают задачи выявления лояльности клиентов с целью введения новых или изменения существующих тарифных планов.

Алгоритмы Data Mining позволяют выявить из огромного количества разнородных данных специфичные знания, которые будут полезными в процессе принятия решений. Таким образом, применение современных технологий в бизнесе - это шаг вперед, это возможность повышения конкурентоспособности и эффективности вашей деятельности.

база данные статистический

Data Mining

Data Mining (русск. добыча данных) -- собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием Пиатецким-Шапиро в 1989 году.

Английское словосочетание «Data Mining» пока не имеет устоявшегося перевода на русский язык, фигурируют термины: интеллектуальный анализ данных (а также аббревиатура ИАД), добыча данных, извлечение данных. Поэтому, в большинстве случаев, используется само английское словосочетание.

Основу методов Data Mining составляют всевозможные методы классификации, моделирования и прогнозирования, основанные на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечеткой логики. К методам Data Mining нередко относят статистические методы (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов), однако, такие методы, как правило, предполагают некоторые априорные представления, например, о наличии распределений, о форме этих распределений.

Одно из важнейших назначений методов Data Mining состоит в наглядном представлении результатов вычислений, что позволяет использовать инструментарий Data Mining людьми, не имеющих специальной математической подготовки. В тоже время, применение статистических методов анализа данных требует хорошего владения теорией вероятностей и математической статистикой.

Надстройка "Пакет анализа"

При проведении сложного статистического или инженерного анализа можно упростить процесс и сэкономить время, используя надстройку "Пакет анализа". Для анализа данных с помощью этого пакета следует указать входные данные и выбрать параметры; расчет будет выполнен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. Некоторые инструменты позволяют представить результаты анализа в графическом виде.

К типичным экономико-математическим приложениям Excel относятся:

* структуризация и первичная логическая обработка данных;

* статистическая обработка данных, анализ и прогнозирование;

* проведение финансово-экономических расчетов;

* решение уравнений и оптимизационных задач.

Структуризация и первичная логическая обработка данных

Списки в Excel являются примером формализованной структуры у исходной информации. Список - это содержащая в рабочем листе Excel таблица, данные в строках которой имеют однородную структуру или данные одного типа. К традиционным задачам первичной или предварительной логической обработки данных относятся сортировка и выборка (фильтрация) по заданному критерию.

Статистическая обработка данных, анализ и прогнозирование

Функции, реализующие статистические методы обработки и анализа данных, в Excel реализованы в виде специальных программных средств - надстройки Пакета анализа, которая входит в поставку Microsoft Office и может устанавливаться по желанию пользователей. Установка надстройки Пакет анализа осуществляется так же, как и установка других надстроек с помощью команды Сервис/Надстройка. Далее необходимо установить флажок перед пунктом Пакет анализа и нажать ОК.

После успешной установки надстройки в меню Сервис появится пункт: Анализ данных, а в окне мастера функций становится доступной категория функций - Статистические.

Целью статистического исследования является обнаружение и исследование соотношений между статистическими (экономическими) данными и их использование для изучения, прогнозирования и принятия решений.

Проведение финансово-экономических расчетов

Одной из важнейших сфер приложения Excel - это осуществление финансовых расчетов. Финансовые вычисления включают в себя всю совокупность методов и расчетов, используемых при принятии управленческих решений (от элементарных арифметических операций до сложных алгоритмов построения многокритериальных моделей, позволяющих получить оптимальные характеристики коммерческих сделок и т.д.).

Поиск решения

Для решения сложных задач, требующих применения линейного и нелинейного программирования, а также методов исследования операций применяется надстройка - Поиск решения. Чтобы использовать надстройку Поиск решения не обязательно знать методы программирования и исследования операций, но необходимо определять, какие задачи можно решать этими методами.

Пользователь должен самостоятельно с помощью диалоговых окон надстройки Поиск решения правильно сформулировать условия задачи, и если решение существует, то “Поиск решения” отыщет его. В основе надстройки лежат итерационные методы.

Общие свойства, которые характерны для задач, решаемых с помощью надстройки Поиск решения:

* Существует единственная целевая ячейка, содержащая формулу, значение которой должно быть сделано максимальным, минимальным или же равным, какому-то конкретному значению.

* Формула в этой целевой ячейке содержит ссылки на ряд изменяемых ячеек. Поиск решения заключается в том, чтобы подобрать такие значения переменных в изменяемых ячейках, которые бы обеспечили оптимальное значение для формулы в целевой ячейке.

* Может быть задано некоторое количество ограничений -- условий или соотношений, которым должны удовлетворять некоторые из изменяемых ячеек.

Диспетчер сценариев «что - если»

При работе с командами Подбор параметра и Поиск решения не существует удобного способа сравнения результатов вычислений - при каждом изменении данных предыдущее значение пропадает.

Чтобы устранить эти ограничения, разработчики Excel создали Диспетчер сценариев, помогающий работать с несколькими моделями «что - если». Командой Сервис/Сценарии можно создавать новые и просматривать существующие сценарии для решения задач, и отображать консолидированные отчеты.

Сравнивать различные сценарии можно, переходя от сценария к сценарию с помощью кнопки показать в окне диалога Диспетчер сценариев, но иногда возникает необходимость в создании отчета с обобщенной информацией о различных сценариях листа.

Список литературы

1. Информатика. Базовый курс / Симонович С.В. и др. - СПб: Издательство «Питер», 2000. 640с.

2. Microsoft Excel 2003: Шерри Виллард Кинкоф -- Санкт-Петербург, НТ Пресс, 2007 г.- 416 с.

3. Саймон Джинджер. Анализ данных в Excel: наглядный курс создания отчетов, диаграмм и сводных таблиц.: Пер. с англ. - М.: Издательский дом "Вильямс", 2004. - 528 с.: ил.

4. Белов В.С. Информационно-аналитические системы. Основы проектирования и применения. Учебное пособие. - М: МЭСИ, 2004.

Размещено на Allbest.ru


Подобные документы

  • Перспективные направления анализа данных: анализ текстовой информации, интеллектуальный анализ данных. Анализ структурированной информации, хранящейся в базах данных. Процесс анализа текстовых документов. Особенности предварительной обработки данных.

    реферат [443,2 K], добавлен 13.02.2014

  • Совершенствование технологий записи и хранения данных. Специфика современных требований к переработке информационных данных. Концепция шаблонов, отражающих фрагменты многоаспектных взаимоотношений в данных в основе современной технологии Data Mining.

    контрольная работа [565,6 K], добавлен 02.09.2010

  • Основы для проведения кластеризации. Использование Data Mining как способа "обнаружения знаний в базах данных". Выбор алгоритмов кластеризации. Получение данных из хранилища базы данных дистанционного практикума. Кластеризация студентов и задач.

    курсовая работа [728,4 K], добавлен 10.07.2017

  • Понятие информационных систем и принципы их проектирования. Изучение различных методов извлечения знаний, построение оптимальной информационной системы Data Mining, позволяющей разбивать набор данных, представленных реляционными базами данных на кластеры.

    аттестационная работа [4,7 M], добавлен 14.06.2010

  • Data Mining как процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). Его закономерности и этапы реализации, история разработки данной технологии, оценка преимуществ и недостатков, возможности.

    эссе [36,8 K], добавлен 17.12.2014

  • Система компьютерной обработки данных для сбора, систематизации, статистической обработки, анализа результатов учебного процесса за четверть, полугодие, год. Модуль обработки данных о качестве обучения, итогов успеваемости и данных о движении учащихся.

    реферат [22,5 K], добавлен 05.02.2011

  • Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.

    реферат [1,3 M], добавлен 25.03.2013

  • Системы автоматизированной обработки информации. Хранение большого объема информации. Понятие базы данных (БД). Обеспечение секретности данных. Уровни представления данных в БД. Логическая структура данных. Ограничения, накладываемые на данные.

    реферат [65,2 K], добавлен 26.11.2011

  • Средства первичной обработки данных MS Excel. Сортировка связанных областей. Виды поиска: по формату; по содержанию. Главные средства фильтрации. Использование форм в поиске записей. Целостная обработка данных таблицы на примере телефонного справочника.

    курсовая работа [426,1 K], добавлен 29.11.2010

  • Классификация задач Data Mining. Задача кластеризации и поиска ассоциативных правил. Определению класса объекта по его свойствам и характеристикам. Нахождение частых зависимостей между объектами или событиями. Оперативно-аналитическая обработка данных.

    контрольная работа [26,1 K], добавлен 13.01.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.