Применение настройки "Анализ данных" и статистических функций для анализа данных
Метод Data Mining (извлечения знаний из баз данных). Структуризация и первичная логическая обработка данных. Анализ и прогнозирование статистической обработки данных. Проведение финансово-экономических расчетов. Решение уравнений и оптимизационных задач.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 17.10.2011 |
Размер файла | 120,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Реферат
по дисциплине
Информационные аналитические системы.
На тему: «Применение настройки «Анализ данных» и статистических функций для анализа данных»
Содержание
- Введение
- Data Mining
- Надстройка "Пакет анализа"
- Структуризация и первичная логическая обработка данных
- Статистическая обработка данных, анализ и прогнозирование
- Проведение финансово-экономических расчетов
- Поиск решения
- Диспетчер сценариев «что - если»
- Список литературы
Введение
В связи с огромными потоками информации в современном мире появляется потребность в информационных технологиях, которые помогут справиться с этим потоком разнородной информации, найти в ней тенденции и закономерности, скрытые от поверхностного взгляда. Методы традиционной математической статистки уже не могут удовлетворить потребности современных аналитиков. Общество пришло к пониманию, что многогигабайтные архивы данных могут принести значительно больше знаний, чем среднее значение по показателю.
В связи с этим широкое применение получила методика Knowledge Discovery in Databases - извлечение знаний из баз данных. KDD представляет собой последовательность действий, которые нужно выполнить для получения знаний. Ядром KDD является технология Data Mining в дословном переводе «раскопка данных».
Data Mining применяется во всех отраслях, где есть данные. Но лидером являются коммерческие предприятия. В частности, в розничной торговле решают задачи прогнозирования спроса, анализа потребительской корзины, стимулирования продаж. Банки используют технологии Data Mining для сегментации клиентов с целью проведения кредитной политики. В телекоммуникациях решают задачи выявления лояльности клиентов с целью введения новых или изменения существующих тарифных планов.
Алгоритмы Data Mining позволяют выявить из огромного количества разнородных данных специфичные знания, которые будут полезными в процессе принятия решений. Таким образом, применение современных технологий в бизнесе - это шаг вперед, это возможность повышения конкурентоспособности и эффективности вашей деятельности.
база данные статистический
Data Mining
Data Mining (русск. добыча данных) -- собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием Пиатецким-Шапиро в 1989 году.
Английское словосочетание «Data Mining» пока не имеет устоявшегося перевода на русский язык, фигурируют термины: интеллектуальный анализ данных (а также аббревиатура ИАД), добыча данных, извлечение данных. Поэтому, в большинстве случаев, используется само английское словосочетание.
Основу методов Data Mining составляют всевозможные методы классификации, моделирования и прогнозирования, основанные на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечеткой логики. К методам Data Mining нередко относят статистические методы (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов), однако, такие методы, как правило, предполагают некоторые априорные представления, например, о наличии распределений, о форме этих распределений.
Одно из важнейших назначений методов Data Mining состоит в наглядном представлении результатов вычислений, что позволяет использовать инструментарий Data Mining людьми, не имеющих специальной математической подготовки. В тоже время, применение статистических методов анализа данных требует хорошего владения теорией вероятностей и математической статистикой.
Надстройка "Пакет анализа"
При проведении сложного статистического или инженерного анализа можно упростить процесс и сэкономить время, используя надстройку "Пакет анализа". Для анализа данных с помощью этого пакета следует указать входные данные и выбрать параметры; расчет будет выполнен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. Некоторые инструменты позволяют представить результаты анализа в графическом виде.
К типичным экономико-математическим приложениям Excel относятся:
* структуризация и первичная логическая обработка данных;
* статистическая обработка данных, анализ и прогнозирование;
* проведение финансово-экономических расчетов;
* решение уравнений и оптимизационных задач.
Структуризация и первичная логическая обработка данных
Списки в Excel являются примером формализованной структуры у исходной информации. Список - это содержащая в рабочем листе Excel таблица, данные в строках которой имеют однородную структуру или данные одного типа. К традиционным задачам первичной или предварительной логической обработки данных относятся сортировка и выборка (фильтрация) по заданному критерию.
Статистическая обработка данных, анализ и прогнозирование
Функции, реализующие статистические методы обработки и анализа данных, в Excel реализованы в виде специальных программных средств - надстройки Пакета анализа, которая входит в поставку Microsoft Office и может устанавливаться по желанию пользователей. Установка надстройки Пакет анализа осуществляется так же, как и установка других надстроек с помощью команды Сервис/Надстройка. Далее необходимо установить флажок перед пунктом Пакет анализа и нажать ОК.
После успешной установки надстройки в меню Сервис появится пункт: Анализ данных, а в окне мастера функций становится доступной категория функций - Статистические.
Целью статистического исследования является обнаружение и исследование соотношений между статистическими (экономическими) данными и их использование для изучения, прогнозирования и принятия решений.
Проведение финансово-экономических расчетов
Одной из важнейших сфер приложения Excel - это осуществление финансовых расчетов. Финансовые вычисления включают в себя всю совокупность методов и расчетов, используемых при принятии управленческих решений (от элементарных арифметических операций до сложных алгоритмов построения многокритериальных моделей, позволяющих получить оптимальные характеристики коммерческих сделок и т.д.).
Поиск решения
Для решения сложных задач, требующих применения линейного и нелинейного программирования, а также методов исследования операций применяется надстройка - Поиск решения. Чтобы использовать надстройку Поиск решения не обязательно знать методы программирования и исследования операций, но необходимо определять, какие задачи можно решать этими методами.
Пользователь должен самостоятельно с помощью диалоговых окон надстройки Поиск решения правильно сформулировать условия задачи, и если решение существует, то “Поиск решения” отыщет его. В основе надстройки лежат итерационные методы.
Общие свойства, которые характерны для задач, решаемых с помощью надстройки Поиск решения:
* Существует единственная целевая ячейка, содержащая формулу, значение которой должно быть сделано максимальным, минимальным или же равным, какому-то конкретному значению.
* Формула в этой целевой ячейке содержит ссылки на ряд изменяемых ячеек. Поиск решения заключается в том, чтобы подобрать такие значения переменных в изменяемых ячейках, которые бы обеспечили оптимальное значение для формулы в целевой ячейке.
* Может быть задано некоторое количество ограничений -- условий или соотношений, которым должны удовлетворять некоторые из изменяемых ячеек.
Диспетчер сценариев «что - если»
При работе с командами Подбор параметра и Поиск решения не существует удобного способа сравнения результатов вычислений - при каждом изменении данных предыдущее значение пропадает.
Чтобы устранить эти ограничения, разработчики Excel создали Диспетчер сценариев, помогающий работать с несколькими моделями «что - если». Командой Сервис/Сценарии можно создавать новые и просматривать существующие сценарии для решения задач, и отображать консолидированные отчеты.
Сравнивать различные сценарии можно, переходя от сценария к сценарию с помощью кнопки показать в окне диалога Диспетчер сценариев, но иногда возникает необходимость в создании отчета с обобщенной информацией о различных сценариях листа.
Список литературы
1. Информатика. Базовый курс / Симонович С.В. и др. - СПб: Издательство «Питер», 2000. 640с.
2. Microsoft Excel 2003: Шерри Виллард Кинкоф -- Санкт-Петербург, НТ Пресс, 2007 г.- 416 с.
3. Саймон Джинджер. Анализ данных в Excel: наглядный курс создания отчетов, диаграмм и сводных таблиц.: Пер. с англ. - М.: Издательский дом "Вильямс", 2004. - 528 с.: ил.
4. Белов В.С. Информационно-аналитические системы. Основы проектирования и применения. Учебное пособие. - М: МЭСИ, 2004.
Размещено на Allbest.ru
Подобные документы
Перспективные направления анализа данных: анализ текстовой информации, интеллектуальный анализ данных. Анализ структурированной информации, хранящейся в базах данных. Процесс анализа текстовых документов. Особенности предварительной обработки данных.
реферат [443,2 K], добавлен 13.02.2014Совершенствование технологий записи и хранения данных. Специфика современных требований к переработке информационных данных. Концепция шаблонов, отражающих фрагменты многоаспектных взаимоотношений в данных в основе современной технологии Data Mining.
контрольная работа [565,6 K], добавлен 02.09.2010Основы для проведения кластеризации. Использование Data Mining как способа "обнаружения знаний в базах данных". Выбор алгоритмов кластеризации. Получение данных из хранилища базы данных дистанционного практикума. Кластеризация студентов и задач.
курсовая работа [728,4 K], добавлен 10.07.2017Понятие информационных систем и принципы их проектирования. Изучение различных методов извлечения знаний, построение оптимальной информационной системы Data Mining, позволяющей разбивать набор данных, представленных реляционными базами данных на кластеры.
аттестационная работа [4,7 M], добавлен 14.06.2010Data Mining как процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). Его закономерности и этапы реализации, история разработки данной технологии, оценка преимуществ и недостатков, возможности.
эссе [36,8 K], добавлен 17.12.2014Система компьютерной обработки данных для сбора, систематизации, статистической обработки, анализа результатов учебного процесса за четверть, полугодие, год. Модуль обработки данных о качестве обучения, итогов успеваемости и данных о движении учащихся.
реферат [22,5 K], добавлен 05.02.2011Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.
реферат [1,3 M], добавлен 25.03.2013Системы автоматизированной обработки информации. Хранение большого объема информации. Понятие базы данных (БД). Обеспечение секретности данных. Уровни представления данных в БД. Логическая структура данных. Ограничения, накладываемые на данные.
реферат [65,2 K], добавлен 26.11.2011Средства первичной обработки данных MS Excel. Сортировка связанных областей. Виды поиска: по формату; по содержанию. Главные средства фильтрации. Использование форм в поиске записей. Целостная обработка данных таблицы на примере телефонного справочника.
курсовая работа [426,1 K], добавлен 29.11.2010Классификация задач Data Mining. Задача кластеризации и поиска ассоциативных правил. Определению класса объекта по его свойствам и характеристикам. Нахождение частых зависимостей между объектами или событиями. Оперативно-аналитическая обработка данных.
контрольная работа [26,1 K], добавлен 13.01.2013