Методы прогнозирования объема продаж

Современные подходы к прогнозированию, история их разработки. Цель и основные этапы процесса прогнозирования. Методы вычисления ошибки прогноза. Анализ методов прогнозирования продаж на примере предприятия Мабел. Выбор оптимального метода прогнозирования.

Рубрика Маркетинг, реклама и торговля
Вид дипломная работа
Язык русский
Дата добавления 16.11.2015
Размер файла 1,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

СОДЕРЖАНИЕ

  • Введение
  • Глава 1. Теоретические аспекты прогнозирования
    • 1.1 История прогнозирования
    • 1.2 Этапы прогнозирования
    • 1.3 Подходы к прогнозированию
  • Глава 2. Анализ деятельности компании Мабел
    • 2.1 Характеристика Мабел
    • 2.2 ABC и XYZ анализ
    • 2.3 Результаты ABC и XYZ анализов
  • Глава 3. Анализ методов прогнозирования продаж для предприятия Мабел
    • 3.1 Методы прогнозирования продаж
    • 3.2 Выбор адекватного метода прогнозирования
  • Заключение
  • Список изпользованных источников
    • Приложение 1
    • Приложение 2
    • Приложение 3

ВВЕДЕНИЕ

Сегодняшние предприятия постоянно ищут стратегии по улучшению работы их структурных подразделений и бизнес-процессов, выполняемых в организации. Прогнозирование в бизнесе сыграло существенную роль в процессе усовершенствования предпринимательской деятельности. Цель бизнес-прогноза объединить статистические анализы и знания предметной области для разработки приемлемых прогнозов, что, в конечном счете позволит принимать менеджменту компании решения в условиях неопределённости. Хороший бизнес аналитик или специалист по прогнозированию должен сосредоточить свое внимание на измерении ключевых показателей бизнеса, таких как продажи и доходы, чтобы предоставить старшему руководству альтернативы бизнес решений, в соответствии с проанализированной статистикой по интересующим показателям. прогнозирование ошибка прогноз продажа

Достижения в области высоких технологий коренным образом изменили возможности для обработки информации, подготовке бизнес и экономических прогнозов. Эти достижения в теории и практике прогнозирования были ответом на возрастающую сложность и конкурентоспособность мирового бизнеса. Сложность повышает риск, связанный с принятием бизнес-решения, что создает потребность в обладании надежным информационным источником данных. Компании всех размеров и всех видов деятельности в настоящее время используют прогнозирование как инструмент для принятия экономических и бизнес-решений. Хотя большинство руководителей осознают необходимость для улучшения прогнозирования, они не всегда должным образом осведомлены о тех средствах, которые в настоящее время находятся на вооружении современного прогнозирования, которые были разработаны в последние несколько десятилетий. Они полагаются на профессиональных сотрудников с таким знанием. С помощью персональных компьютеров, специалисты в состоянии использовать сложные методы анализа данных для целей прогнозирования.

Целью прогнозирования является обеспечение менеджеров информацией, которая будет способствовать принятию решений. Практически каждая организация, государственная или частная, работает в условиях неопределенности и динамичной среде. Прогнозирование является неотъемлемой частью планирования и системы управления, поскольку прогнозирование позволяет компаниям эффективно и своевременно предсказывать будущее. Топ-менеджмент, как правило, заинтересован в принятии решений, основанных на прогнозировании экономических факторов, которые имеют решающее значение в стратегическом планировании и деятельности организации. Хотя прогнозирование не может предоставить точной картины будущих событий, но может уменьшить степень неопределенности для принимаемых решений, что в свою очередь позволяет увеличить эффективность данных решений.

Прогнозирование используется практически во всех отделах компании, каждый из которых имеет свои собственные потребности. Менеджерам по управлению производством необходимо регулярно создавать краткосрочные прогнозы спроса на продукцию, а также долгосрочные прогнозы спроса с учетом новых линий продукции, новых рынков и неопределенных условий спроса. Маркетологи создают прогнозы, чтобы увидеть динамику развития рынка, а также его характеристик такие, как доля рынка, тенденции в ценах, источники конкуренции. Помимо всего вышеперечисленного спрос на продукцию, доходы от продаж и инвентаризации можно также ввести в процедуру прогнозирования. В финансовом отделе организации также используются процедуры прогнозирования, с целью получить информацию о тенденциях развития компании, о будущих поступлениях, для планирования деятельности компании. Поэтому прогнозирование является неотъемлемой частью деятельности организации для долгосрочного нахождения на рынке.

Целью данной дипломной работы стоит изучение наиболее распространенных методов прогнозирования, а также тех процедур, которые сопутствуют процессу получения прогнозных значений и измерения точности прогнозов, с помощью оценки ошибок прогнозирования.

Проблема, поставленная перед исследованием - это изучение точности прогнозирования с применением различных моделей и определение метода, который наиболее точным образом описывает объемы продаж будущего периода.

В задачи исследования входит:

- проведение ABC и XYZ анализа

- определения целевой группы «AX»

- прогнозирование с помощью 9 различных методов

- оценка ошибок прогноза

- выбор наиболее точного метода

Гипотеза исследования предполагает, что наиболее точным методом прогнозирования окажется модель многомерной регрессии, поскольку при расчете она учитывает несколько независимых переменных, поэтому она наиболее точным образом описывает ситуацию продаж.

Объектом данного исследования станет светотехническая компания Мабел. А предметом будут методы прогнозирования, которые будет сравниваться путем эксперимента.

ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ПРОГНОЗИРОВАНИЯ

1.1 История прогнозирования

Современные подходы к прогнозированию были разработаны еще в девятнадцатом столетии, ярким подтверждением этого факта может являться метод регрессионного анализа [5]. Однако, среди часто используемых практик в прогнозировании есть наряду с теми, чьи корни уходят веками назад, и такие, как техники Бокса-Дженкинса, нейронные сети, используемые для целей нахождения прогнозных значений.

С развитием, а также сопровождающимся ростом уровня сложности для аппаратов прогнозирования, появлением и широким распространением компьютеров, которые были оснащены специальными программами для получения прогнозов, бизнес-процессу прогнозирования стали уделять гораздо больше внимания, как к процессу способному уменьшать степень неопределенности при принятии решений. В настоящее время практически каждый менеджер в крупных и компаниях среднего уровня может использовать в целях получения прогнозных значений достаточно сложный аппарат анализа больших массивов данных[16]. Это приводит к тому, что менеджеры должны относится ответственно к выбору математического аппарата для целей прогнозирования, поскольку даже использование сложной программы для анализа данных в несоответствующем контексте может привести к получению некорректных значений прогноза[7, c .89].

Техника для целей прогнозирования продолжает свое развитие и все новые методы и техники прогнозирования разрабатываются для различных целей в условиях современной доступности информации, для получения более точных значений прогноза [22]. Основной задачей перед разработчиками программ данного направления бизнеса является уменьшение естественной составляющей прогноза - ошибок. Поскольку на сегодняшний день не существует метода прогнозирования, который полностью был очищен от возможности возникновения ошибок, то развитие данной отрасли остановилось, однако поскольку такой метод еще не разработан, то человек занимающийся прогнозированием в силах лишь смягчить, если это представляется возможным, последствия от возникновения данных ошибок в прогнозе [40 c .43].

1.2 Этапы прогнозирования

Организации действуют в условиях неопределенности, однако несмотря на это, менеджеры должны принимать те решения, которые будут оказывать влияние на будущую деятельность компании и принимать максимально верные решения [15]. Поскольку процедуры прогнозирования вне зависимости от их типа качественные они или количественные являются обоснованными, то именно это служит причиной опираться на данных полученные из прогнозов, а не на другие полученные необоснованным путем [22].

Соотношение использования количественных и качественных методов в прогнозировании значительным образом изменилось в последние годы, в связи с распространением компьютеров, ранее до возникновения серьезного математического аппарата прогнозирования оценка менеджера, часто интуитивного характера была единственно возможным вариантов получить какие-либо предположения о характере наблюдаемых событий в будущем. Благодаря работам, связанным с количественными методами прогнозирования Макридакиса стало понятно, что использование тех прогнозов, которые основываются только на качественных оценках не могут быть настолько же точными, как те, которые имеют математическое обоснование полученных значений [35 c.382]. Также в долгосрочной перспективе использование качественных методов прогнозирования оказывается существенно дороже, чем использование программного обеспечения, основывающегося на количественных подходах [14].

Тем не менее, точность в прогнозировании не может быть достигнута лишь путем использования программ соответствующего назначения [48]. В такой ситуации мы лишь получим лишь информацию, которая без должного знания и понимая даже если будет точной, может оказаться совершенно бесполезной для нужд компании, с другой стороны менеджер, игнорирующий все возможные техники количественного анализа. Данные примеры служат показать, что применение лишь одного подхода, может быть чересчур категоричным шагом менеджера и в конечном итоге привести к негативным последствиям для всей организации [27].

Программное обеспечение и компьютеры стали совершенно неотъемлемой частью любой организации вне зависимости от ее размеров или направленности, а также принадлежности к частному бизнесу или государственному, потому что каждая компания нуждается в процедуре планирования [4]. Причем важно понимать, что прогнозы используются компанией практически во всех стратегически важных ее отделах, таких как: финансовый, маркетинг, рекрутинг, логистика и многих других для принятия обоснованных решений в условиях неопределенности.

Существуют различные классификации по типам прогнозов, которые могут рассматривать их в зависимости от временной перспективы прогнозирования, так и по их позиции, которую они занимают в макро или микро-континууме, также как уже упоминалось может быть произведено деление путем отнесения прогнозов к количественным или к качественным типам прогнозов, от того какие цели стоят перед тем или иным отделом, или конкретным менеджером будут использованы различные подходы к прогнозированию [9]. Долгосрочное прогнозирование свойственно для стратегического отдела предприятия, обычно прогнозы данного типа являются основной потребностью высшего звена менеджмента, которое определяет перспективы развития организации, напротив краткосрочные прогнозы должны использоваться оперативными отделами, в которых необходимо получение данных для принятия безотлагательных решений [21]. Использование краткосрочных прогнозов осуществляется на уровне среднего и нижнего менеджмента, которые ответственны за принятие решений в конкретный момент для организации.

На начальном этапе выборе метода требуется определить степень детализации, то есть понять какой из макро или микро-прогнозов нам нужен, следующим шагом будет определение временной перспективы, на которую должен быть рассчитан прогноз и заключающим этапом станет детерминация фактора использования количественных или качественных оценок, либо определения их соотношения при принятии конечного решения [37]. Возможность анализа методов прогноза при выборе одного из них для целей прогнозирования должна позволить менеджеру упростить процедуру принятия решения [2, c.11]. Основополагающим требованиям будет не возможная сложность математического аппарата, а точный и понятный результат прогноза, который можно интерпретировать для принятия менеджером решений, также важно отметить, что помимо вышеперечисленного прогнозирование используется как возможность косвенно влиять на прибыльность, поэтому процедура проведения прогнозной оценки должна в первую очередь быть рентабельной [12, c.57].

Процесс прогнозирования представляет собой экстраполяцию предыдущих наблюдений для получения некоторого представления о том, как ситуация будет выглядеть в будущем. Понимание этого факта, приводит к тому , что аппарат прогнозирования анализирует и подвергает обработке те данные, которые произошли и неотличимы от условий будущего, однако это не всегда верно, поскольку расчет показателей эффективности рабочих основанных лишь на их оценках при приеме на должность будет не точном, поскольку возможно изменение данных показателей, поэтому процесс прогнозирования может быть разбит на несколько составляющих:

- Сбор данных

- Редукция или уплотнение данных

- Построение модели и ее оценка

- Экстраполяция выбранной модели

- Оценка полученного прогноза

Первый этап предполагает получение верных данных, а также проведение необходимой проверки достоверности и полученных данных [35 c .382]. Данный этап является наиболее важным для всей последующей процедуры прогнозирования, поскольку без должной проверки корректности данных, мы можем провести прогноз для неверных данных, соответственно получив в итог результат несоотносимый с реальными показателями.

Второй этап может быть необязательным, однако очень часто без его наличия корректно осуществить прогнозирование не представляется возможным. Возможны ситуации, когда на втором этапе специалисту по построению прогнозов становится понятно, что исходные данные полученные для проведения прогноза собраны в недостаточном количестве, либо в избыточном [1, c.359]. И тот и другой вариант не позволяют построить точный прогноз, если в случае с недостаточным количеством данных это представляется очевидным, то во втором случае возможно собраны данные, которые не относятся к исследуемому предмету прогнозирования, тем самым лишь увеличивая количество ошибок прогноза и снижая его точность. Также на этом этапе данные проходят проверку на соответствие контексту, поскольку если мы собираемся построить прогноз для продаж электрических автомобилей, то целесообразно брать данные за последние 5 лет, а не за 50, во втором случае мы получим неточный прогноз из-за несоответствия контексту рассматриваемой задачи [8, c.24].

Третий этап может быть описан, как построение модели прогноза и ее оценка, суть данного этапа сводится к выбору конкретной модели прогнозирования, которая будет осуществлять посредством заданного алгоритма экстраполяцию предыдущих наблюдений. На данном этапе менеджеру следует осознавать, что чем проще представленная модель прогнозирования, тем легче она будет для понимания ее результатов, что является важнейших фактором при принятии решения топ-менеджментом. Это означает, что более простые модели представляют понятные результаты, которые активно используются при принятии решений [2, c.194].

Четвертый этап заключается в переносе выбранной модели прогнозирования на будущие периоды, что подразумевает получение конкретных значений прогноза, также на данном этапе совершается моделирование прогноза для уже наблюдаемых данных, для оценки точности прогноза, таким образом будут получены ошибки прогноза. Однако непосредственно анализ полученных отклонений в ходе проведения процедуры прогнозирования на уже совершившиеся события будет рассмотрен в пятом этапе [17].

Пятый этап является заключительным на данном этапе производится оценка полученных прогнозных значений, оценке ошибок прогноза. Для оценки ошибки прогноза используются различные техники, которые подразумевают сложение абсолютных значений прогноза, которая в зависимости от техники оценки может оставаться как суммой отклонений при прогнозе, так и делится на количество наблюдаемых ошибок, с целью поиска средней ошибки по прогнозу. Существуют также методы, которые основываются на сумме квадратов ошибок.

Основная часть прогнозирования стоит на фундаментальных статистических понятиях [31], они и будут рассматриваться в данной части главы. В основном статистические показатели используют, чтобы дать более детальное представление о структуре данных в генеральной совокупности. Цель данных процедур в статистике сводится к возможности описать большой массив данных с помощью некоторых наиболее важных, ключевых значений. Подавляющее большинство статистик описывают массиву путем усреднения значений наблюдений [50 c.459]. Самая распространенная процедура заключается в поиске выборочного среднего значения , которое определяется по формуле сложения всех имеющихся наблюдений и деленных на количество наблюдений:

,

где

;

;

.

Наряду с частным использованием выборочного среднего, при процессе определения тенденции данных к группировке вокруг среднего значения используют показатель средне квадратического отклонения:

В данном уравнении мы имеем суму квадратов разностей между наблюдениями и их средним значением [28].

Среднее значение и среднеквадратическое отклонение считаются одними из наиболее важных характеристик при необходимости описания набора данных совокупности. Их основное преимущество заключается в том, что они достаточно просты к вычислениям и предоставляют содержательные характеристики данных наблюдений. Также наряду с использованием среднеквадратического отклонения и нахождения выборочного среднего, для определения центрального значения из рассматриваемых данных применяется процедура поиска медианы. Медианой называют значение, которое делит выборку на две части, причем в одной они будут меньше, а в другой больше значения медианы. Размах используется для того, чтобы примерно оценить дисперсию выборки, чтобы вычислить размах требуется из самого большого значения выборки вычесть наименьшее.

Для изучения присутствия линейной зависимости в наборе данных между двумя величинами, а также для определения силы данной зависимости может быть использован коэффициент корреляции [44]. Данный коэффициент измеряется от -1 до 1. Минимальное значение коэффициента корреляции равное -1 показывает, что рассматриваемые величины имеют совершенную отрицательную зависимость, в данном случае увеличение одной повлечет уменьшение другой, с другой стороны коэффициент равный +1 будет свидетельствовать о наличии совершенной положительной зависимости между двумя величинами [26, c.198]. В том случае если коэффициент корреляции равен 0, то линейная зависимость отсутствует. Коэффициент корреляции можно найти по формуле:

При использовании коэффициента корреляции следует учитывать несколько критически важных моментов, первое на что требуется обратить внимание, это что коэффициент корреляции показывает данные о наличии зависимости между двумя величинами, однако он не может быть использован в качестве средства при определении причинно-следственной связи между факторами, таким образом будет некорректно сказать, что если между величинами присутствует корреляция, то это означает влияние одного фактора на другой, поскольку изменение двух величин может быть вызвано изменением третьего фактора, который не включен в анализ коэффициента корреляции [29 c .34]. В данном случае решение о наличии причинно-следственной связи между величинами принимает эксперт, поскольку в реальной жизни могут цена на продукты в Санкт-Петербурге коррелировать с ценами на продукты в Екатеринбурге, однако неверно будет полагать, что какая-то из этих величин оказывает влияние на другую, в данном примере цены будут зависеть от экономической обстановки в стране.

Во-вторых, коэффициент корреляции направлен на определение наличия линейной зависимости, в то время если расчет коэффициента показывает, что линейная зависимость равна 0 или находится в пределах низкой корреляции, то неверно будет полагать, что между переменными не существует совершенно никакой зависимости, поскольку рассматриваемые величины, могут быть подвержены нелинейной зависимости [33].

Этап представляющий собой сбор данных, проверку их на достоверность, является одним из наиболее сложных из всех этапов прогнозирования, поскольку, если будет допущена ошибка на данном этапе, то заметить ее присутствие будет крайне сложно при последующих вычислениях, поэтому неверные данные на входе дают на выходе неверные прогнозные значения, которые не имеют релевантности по отношению к прогнозируемой величине. Точность прогноза во многом определяется точностью данных, которые будут использованы при построении модели прогнозирования [42]. Из-за большого развития интернета, в общественном доступе появились практически все необходимые показатели для составления макропрогнозов для государств, также присутствует достаточно информации, чтобы делать прогнозы в рамках развития организации, однако наличие большого количества информации в общем доступе не всегда благоприятно сказывается на точности прогноза, поскольку факторы, которые включаются в модель прогнозирования должны иметь непосредственное отношение к исследуемому объекту [35 c.382]. Для того, чтобы оценить будут ли искомые данные полезны при поиске решения для какой-то конкретной задачи можно воспользоваться проверкой по следующим четырем критериям:

а) Точность и достоверность исходных данных.

Соблюдение данного критерия подразумевает использование данных, которые получены из источников достоверной информации, а также требует, чтобы данные соответствовали контексту исследуемого объекта.

б) Значимость данных.

Данные будут отражать анализируемые обстоятельства.

в) Согласованность данных.

В данном случае имеется ввиду, что при обстоятельстве изменения данных для объекта, для которого они были собраны должны быть внесены соответствующие корректировки, которые позволят сохранить согласованность новых данных с исторически сложившейся структурой.

г) Привязка ко времени.

Данный критерий позволяет проверить данные на их хронологическое соответствие, таким образом данные которые удовлетворяют данному критерию являются наиболее предпочтительными для проведения прогноза, также здесь необходимо отметить, что данных может быть слишком мало, это означает, что недостаточно исторической предыстории, однако также важно понимать, что использование слишком большого количества данных накопленных за время, может повредить точности прогноза из-за возможной низкой релевантности в контексте прогнозируемого объекта [30].

Основными при проведении прогнозов могут считаться две категории данных. Первые представляются собой набор данных, которые были собраны в какой-то конкретный момент времени, это могут быть данные за различные промежутки времени: часы, недели, годы, декады и так далее. Вторая категория данных показывает данные которые были собраны с течением времени. Первый тип данных называют кросс-секционными, их основная задача заключается в том, чтобы выяснить взаимосвязи внутри исследуемой совокупности, с целью экстраполяции полученных результатов на генеральную совокупность. Данные, которые были собраны с течением времени называются временными рядами, обычно для этих данных существуют одинаковые интервалы во времени, через которые собираются данные об этих объектах.

Количественная модель прогнозирования используется при прогнозировании временных рядов, для обозначения величины в конкретный момент времени, прогнозного значения и ошибки прогноза используются следующие показатели [19]:

При оценке ошибки прогноза используется несколько методов, большинство которых заключается в усреднении некоторых функций ошибок и фактических значений. Для вычисления ошибки прогноза используется разность между фактическим значением и значением прогноза, полученным для данного момента времени.

Наиболее распространенный метод вычисления ошибки прогноза заключается в сложении абсолютных значений погрешности прогноза и деление на количество наблюдений. Данный метод называется среднее абсолютное отклонение (Mean Absolute Deviation, MAD) [40 c .43]. Использование данной техники оценки ошибки прогноза возможно в случае, если специалист осуществляющий измерение ошибки прогноза пытается получить в тех же единицах, в которых находится исходный ряд. Ошибка среднего абсолютного отклонения измеряется по формуле:

Следующий способ оценки ошибки прогнозирования - среднеквадратическая ошибка (Mean Squared Error, MSE) [27], который заключается в возведении в квадрат каждой ошибки прогноза и последующего суммирования всех ошибок в квадрате, сумма которых делится на количество наблюдений. Данная техника в силу своей особенности возведения ошибок в квадрат, является необходимой для того чтобы обратить внимание специалиста на большие погрешности, допущенные моделью при прогнозировании. В таком случае при сравнении двух методов, один из которых дает ошибки средней величины, а другой дает небольшие, но пиково попадаются существенные отклонения, может оказаться первый метод предпочтительнее. Среднеквадратическая ошибка прогноза вычисляется по формуле:

Однако вычисление абсолютных величин погрешностей не всегда является предпочтительным, поскольку расчет средней абсолютной ошибки в процентах позволяет оценить величину расхождения прогнозного значения и фактическими данными в процентном отношении. Средняя абсолютная ошибка в процентах (Mean Absolute Percentage Error, MAPE) [20, c.96] высчитывается путем расчета абсолютной величины ошибки в каждый конкретный момент и делением на фактическое значение наблюдаемое в данный период времени, сумма данных действий по всем позиция прогноза суммируется и делится на количество наблюдений прогноза. Существенным преимуществом данного подхода является то, что в случае если исходный ряд содержит большие значения, то в итоге мы получим оценку прогноза в процентах, значение которой не будет превышать трех знаков. Расчет данного показатель оценки ошибки прогноза, средней абсолютной процентной ошибки производится по формуле:

Метод средней процентной ошибки (Mean Percentage Error, MPE) [48] помогает определить существует ли смещение в прогнозных значениях, является ли полученный прогноз постоянно заниженным или завышенным. Вычисление средней процентной ошибки происходит путем выявления ошибки прогноза в каждый момент времени, с последующим делением найденной погрешности на фактическое значение характеризующее данный период, последующее суммирование полученных результатов предыдущих действий и деление на количество наблюдений позволяет оценить ошибку прогноза методов средней процентной ошибки. Для анализа данного показателя требуется понимать, что полученное слишком большое положительное значение в процентах означает, что метод является постоянно недооценивающим, то есть прогнозные значения меньше фактических, в случае если значение прогноза является большим отрицательным, то это означает, что рассматриваемый метод прогнозирования, для которого проводится оценка ошибок прогноза последовательно переоценивающий. Формула, которая описывает процесс нахождения средней процентной ошибки:

Решении о выборе того или иного метода прогнозирования часто основывается на оценки ошибок прогноза, которые получается при вычислении таких показателей как MAD, MSE, MAPE, MPE, правильно выбранный метод будет давать наименьшее отклонение от фактических значений, то есть будет является наиболее точным в прогнозировании будущих показателей.

1.3 Подходы к прогнозированию

В группу простых методов прогнозирования относят модели усреднений, сглаживания, а также наивные методики. При прогнозировании с помощью наивных методов строится модель, которая предполагает, что данные будущих периодов лучшим образом описываются последними произошедшими событиями аналогичного характера. Методы усреднения позволяют выполнить процедуру прогнозирования, учитывая при этом, среднюю динамику показателей за прошлые наблюдения. Сглаживающие методы позволяют построить прогноз с применением техники усреднения прошлых данных, с учетом уменьшающихся весовых коэффициентов.

Наивные модели обычно используются организациями достаточно молодыми, которые пока не имеют достаточной базы данных на основе которой можно строить сложные математические модели прогнозирования, поскольку в наивных моделях используется прогнозирование на основе последних наблюдений, то это удовлетворяет возможностям компаний, которые пока не накопили базы наблюдений [39]. Наивное прогнозирование для конкретного периода представляет собой фактическое значение предыдущего периода, такой вид прогноза называется неизменяемым прогнозом, так как текущему значению показателя дается 100% вес при расчете прогноза. В таком случае прогноз рассчитывается по формуле:

В случае если требуется постоянное обновление прогнозов, а наименования для которых требуется совершить данную процедуру исчисляются тысячами, то не всегда у специалиста по прогнозированию есть возможность, определить прогнозные значения для каждого конкретного наименования, выходом из данной ситуации может стать использование недорого краткосрочного планирования, методикой, которая основана на усреднении и сглаживании данных в рядах [10, c.137]. В основе данных методов лежит предположение о том, что различного рода флуктуации и пиковые значения носят случайный характер, это означает что прогнозирование данным методом подразумевает построение некой гладкой кривой, продолжение которой будет показывать прогнозные значения. Существует несколько приемов с помощью которых можно сгладить различные колебания в рядах данных. Целью будет построение модели для получения прогнозных значений будущих периодов, исходя из прошлых наблюдений. В данной формуле показан пример усреднение данных, на основе которых строится прогноз:

Метод использующий технику простых средних может быть полезен в случаях, когда процесса, которые являются генераторами временных данных показывают стабильность, а окружение, в котором находятся данные ряды неизменно.

Скользящие средние в отличие от метода простых средних учитывает последние наблюдения, в то время как простых средних задействован весь временной ряд. Суть модели скользящих средних заключается в постоянном обновлении модели прогнозирования путем замещения наиболее старых наблюдений на новые, непосредственно полученные, таким образом аналитик получает прогнозные значения исходя из последних наблюдений [18]. В простом виде формула скользящего среднего вычисляется:

k - число членов в скользящем среднем.

Важным аспектом применения данного метода является то, что каждому наблюдению из k наблюдений в формуле присваивается одинаковые весовые коэффициенты. Скорость реакции на изменения будет напрямую зависеть от количество рассматриваемых наблюдений, чем их будет больше, тем скорость будет меньше, однако при неизменной окружающей обстановке, в которой находятся исследуемые наблюдения точность прогноза будет выше, чем при использовании меньшего количества наблюдений [50 c.459].

Техника прогнозирования в основе которой лежат двойные скользящие средние подходит для данных, которые имеют линейный тренд. Суть данного подхода заключается в вычислении ряда с помощью скользящих средних, исходя из полученных значений скользящих средних производится усреднение, полученное значение и будет прогнозом [46 c.195]. Способ расчета двойного скользящего среднего показан в формулах:

После расчета скользящего среднего для каждого периода, участвующего в прогнозе, вычисляется вторичное скользящее среднее:

Далее необходимо рассчитать разницу между удвоенным двойным скользящим средним и простым скользящим средним:

Также для построения модели прогнозирования двойных скользящих средних необходимо рассчитать корректировочный фактор, суть которого схожа с коэффициентом наклона прямой:

В конечном итоге уравнение двойных скользящих средних выглядит следующим образом:

В данном случае будет получен прогноз на следующий период, в зависимости от того какой горизонт прогнозирования ставит перед собой аналитик, он может легко рассчитать на n периодов вперед прогноз, для этого нужно умножить коэффициент “b” на n, оставив остальную часть формулы неизменной.

В сравнении с методами, которые используют техники прогнозирования с применением скользящих средних, в которых используются наиболее актуальная информация доступная на данный момент времени, то методы экспоненциального сглаживания используется взвешенное скользящее усреднение всех данных из предыдущих наблюдений. Данные, которые наибольшим образом подходят для экспоненциального сглаживания не имеют четкого тренда. Экспоненциальное сглаживание предусматривает не только постоянное обновление модели, как и модель скользящих средних, но и присваивает наибольшие коэффициенты последним наблюдениям, как наиболее репрезентативные [34 c.264]. Коэффициента веса для последнего наблюдения определяется по формуле б, для предыдущего по формуле (1-б), следующее за ним (1-б)2, причем 0<б<1. Формула, по которой рассчитывается прогноз по модели экспоненциального сглаживания выглядит следующим образом:

Прогноз построенный с применением экспоненциального сглаживания представляет собой старый прогноз, который учитывает ошибку прогноза с коэффициентом б, который является взвешивающим фактором [21]. Значение постоянной сглаживания зависит от того какое наблюдение оказывает наибольшее влияние на значение прогноза, если оно взвешивающий фактор приближается к 1, то это означает, что ошибка последнего прогноза будет существенно оказывать влияние на прогноз. В тоже время минимальное значение б будет свидетельствовать о том, что значение нового прогноза будет приближено к значению предыдущего прогноза [36 c.1518]. Постоянная сглаживания будет являться ключевым значением при построении прогноза, поскольку если ситуация требует получения прогноза для данных без серьезных отклонений, и чтобы они были сглажены, то требуется брать минимальное значение б. Большое значение б может быть применено аналитиком в случае, если требуется получить быструю реакцию на изменения. Для определения значения б производится оценка ошибки прогнозов построенных с различными показателями постоянной сглаживания {0,1;0,2;…;0,9} для того показателя б, который показал наименьший результат при оценке ошибок прогноза и будет использован при дальнейших вычислениях. Аналитиком может использоваться прием следящего сигнала, который просигнализирует, если новые прогнозы будет давать слишком сильные отклонения и динамика примет негативный характер точности, в этом случае необходим пересмотр коэффициента постоянной сглаживания [34 c.264].

Линейная регрессия представляет прямую, которая составлена с учетом наблюдений двух параметров и на основе которой можно предположить будущие значение одной из величин, зная значение другой величины [25]. Для того, чтобы определить местоположение прямой на графике, на котором отмечены точками наблюдения будет использована процедура критерия наименьших квадратов, поскольку позволяет добиться лучшего приближения по отношению ко всем наблюдениям, нанесенным на график. Уравнение прямой приближения имеет вид:

Первый параметр является свободным членом уравнения, второй показывает тангенс угла наклона. Метод наименьших квадратов позволяет аналитику подобрать значения коэффициентов такими, чтобы сумма всех отклонений была минимальной [44]. Коэффициенты для уравнения линейной регрессии рассчитываются следующим образом:

Разности, полученные при вычитании фактического значения из прогноза, называются отклонениями. Отклонениями называют перпендикуляры, опущенные из точек наблюдений на прямую регрессии. Для того, чтобы оценить степень отклонения исходных точек от полученной прямой регрессии используется процедура оценки стандартной ошибки, вычисляется по формуле:

Оценка стандартной ошибки показывает уровень отличия между фактическими значениями и прогнозируемого [30]. Для больших по объему рассматриваемых данных, данные показатель следует ожидать на уровне 67% ошибок прогноза по модулю будут меньше чем оценка стандартной ошибки и порядка 95% ошибок по модулю не будут больше чем 2. В случае если получена небольшая стандартная ошибка, то это означает что прямая регрессии хорошо описывает данные, поскольку все точки наблюдений находятся недалеко от прямой.

Использование стандартной ошибки прогноза, позволяет создать интервальный прогноз, который будет предпочтительнее по ряду факторов, во-первых, данный прогноз, позволяет избежать неопределенности, которая может возникнуть по причине того, что в точечном прогнозе, наблюдения не лежат на прямой регрессии, а находятся в среднем в пределах квадратного отклонения. Во-вторых, при построении точечного прогноза возможны неточности, которые вызваны отклонением прямой регрессии для выборочной совокупности от прямой генеральной совокупности [49].

Стандартная ошибка прогноза дает необходимую меру вариации прогнозируемого значения, которая позволяет избежать вышеуказанных неопределенностей точечного прогноза [31]. Стандартная ошибка прогноза вычисляется по формуле:

Если модель, которая была построена с применением линейной регрессии верна, то интервалы для прогнозируемого значения будут находится в пределах интервала , где в данном случае t означает квантиль распределения Стьюдента с количеством степеней свободы равному n-2. Если объем выборки достаточно большой, то есть больше или равен 30 наблюдений, то значения прогноза будут находиться в интервале . Также наряду со стандартной ошибкой прогноза используется коэффициент детерминации, который равен квадрату коэффициента корреляции, данный показатель измеряется в пределах 0<r2<1. Коэффициент детерминации равный нулю показывает, что изменение одной величины никак не связано с изменениями другой величины, поэтому данная модель не объясняет изменения прогнозируемого значения Y. В случае, когда коэффициента равен 1, то это означает, что построенная модель описывает 100% случаев изменения Y от X [31].

Простая линейная регрессия исследовала наличие взаимосвязи между зависимой и независимой переменными, если данная зависимость между величинами обнаружена, то найти значение зависимой переменной не составляет труда. Однако линейная регрессия показывает зависимость между двумя факторами, в то время как в условиях расширения процесса глобализации исследования зависимости между двумя переменными бывает недостаточно, поскольку многие факторы зависит от целого спектра независимых величин. Модель многомерной регрессии позволяет учитывать несколько переменных, в целом многомерная регрессия схожа своими понятиями с линейной регрессией, однако есть и отличия, которые обусловлены тем, что в модели используется больше одной переменной [44].

В случае, если с помощью модели линейной регрессии мы получили коэффициент детерминации 75%, означающий, что данная модель не описывает четверть изменчивости исследуемого объекта, то нам необходимо найти еще одну переменную, которая бы позволила увеличить процент описанной изменчивости. Важным аспектом поиска заключается нахождение такой переменной, которая не была бы тесно связана с уже выбранной ранее, поскольку корреляция между переменными может привести к мультиколлинеарности. Это означало бы, что выбранные переменные при высоком коэффициенте корреляции между собой, описывают ту же изменчивость, которую описывала и одна переменная. Для того, чтобы корректно создать модель прогнозирования методом многомерной регрессии требуется составить корреляционную матрицу, в которой были бы отражены коэффициента корреляции для каждого сочетания факторов.

Таблица 1 - Пример корреляционной матрицы[41, c 230]

Переменные

№1

№2

№3

№1

R11

R12

R13

№2

R21

R22

R23

№3

R31

R32

R33

Поскольку коэффициенты будут повторятся, а R11=R22=R33=1, то нас будет интересовать только коэффициенты R12, R13, R23 в случае если один из этих коэффициентов будет достаточно положительным, а другой будет показывать отрицательную зависимость, то скорей всего коэффициент детерминации данной модели может быть увеличен, путем включения данных факторов. В многомерной регрессии математическое ожидание для зависимой переменной может быть выражено функцией:

Это же выражение также используется для многомерной регрессии генеральной совокупности. В простой линейной регрессии наблюдения обозначаются парой переменных (), в то время как в многомерной регрессии наблюдения описываются сочетанием значения зависимой переменной и значением независимой переменной, где i-е наблюдение j-й независимой переменной будет обозначаться символом . Для удобства рассмотрения наблюдений в многомерной регрессии используется табличный вид, где n - число наблюдений, а k - число независимых переменных.

Таблица 2 - Общий вид данных модели многомерной регрессии[28, c 97]

Наблюдение

Независимые переменные

Зависимая переменная

1

2

3

4

5

6

№1

X11

X12

X1k

Y1

№2

X21

X22

X2k

Y2

№i

Xi1

Xi2

Xik

Yi

№n

Xn1

Xn2

Xnk

Yn

Зависимая переменная, которая принимает обозначение Y - это случайная величина, которая имеет связь с независимыми переменными описанную следующим соотношением:

В данной формуле приняты следующие обозначения:

а. е - это ошибки, которые соответствуют значению отклонения зависимой переменной от истинного значения. Предполагается, что ошибки независимы и имеют нормальное распределение.

б. Коэффициенты регрессии , неизвестны.

Уравнение регрессии будет принимать вид:

В данном уравнении присутствуют коэффициенты b0, b1, bk. Значение коэффициента b0 по-прежнему обозначает свободный член функции регрессии, как и в линейной регрессии [25]. Коэффициенты b1 и b2 называют чистыми или частными коэффициентами регрессии, каждый из которых будет измерять среднее изменение для величины Y при однократном изменении корреспондирующей с ней независимой переменной.

Интервальный прогноз для будущего значения зависимой переменной можно получить путем нахождения доверительного интервала для выборки большой по объему и где все X - независимые переменные, в таком случае доверительный интервал для получения стандартной ошибки прогноза можно вычислить по следующей формуле:

Для того, чтобы уравнение регрессии наилучшим образом описывала взаимосвязь между независимыми факторами и исследуемым, необходимо для начала определить те независимые факторы, которые будут учитываться при построении модели прогнозирования. На данном этапе требуется включение всех переменных, которые по мнению аналитика будут улучшать точность прогнозирования. Также требуется учитывать затраты, которые будут понесены с включением каждой новой переменной в модель, поэтому специалист прогнозирования должен найти консенсус между двумя противоречащими условиями:

- Использование большего набора независимых факторов, которые не будут описывать изменчивость, описанную другими уже включенными в прогноз факторами.

- Соотношения затрат и увеличенной точности прогноза за счет включения в нее новых переменных. Поскольку сбор и обработка информации для независимых факторов представляет затраты, то они должны быть соотносимы с точностью прогноза.

После того, как специалист по прогнозированию собрал все необходимые потенциальные независимые переменные, требуется произвести более детальный отбор и убрать ту часть из них, которая может не соответствовать контексту исследуемой проблемы [39]. Независимый фактор может быть исключен из списка, претендующих на попадание непосредственно в процесс прогнозирования из-за отсутствия существенного отношения к поиску решения для данной задачи. В случае если существует проблемы такого рода, когда одна независимая переменная описывает ту же изменчивость зависимой переменной, что и предыдущая, то это вызовет мультиколлинеарность, то есть наличие линейной зависимости между независимыми переменными, что приведет к ухудшению точности прогноза. Также недопустимы случаи попадания в модель тех независимых факторов, которые не имеют реальной взаимосвязи с исследуемым объектом. Иногда сбор и обработка большого количества данных может быть слишком затратным, поэтому в данном случае тоже возможен отказ от поиска, тех данных которые в несколько раз увеличивают стоимость прогноза, но лишь немного уменьшают ошибки возникающие в процессе прогнозирования. Следующий шаг в поиске оптимального уравнения регрессии также будет сокращать количество независимых переменных, существует несколько способов, с помощью которых можно удалить нерелевантные факторы из модели, однако ни одна из этих процедур не может гарантировать получение наилучшего уравнения, также здесь стоит понимать, что каждый из способов, который будет сокращать количество независимых переменных может использовать совершенно разные подходы и поэтому на выходе ожидаемо получение совершенно разных наилучших уравнений для каждого из методов.

Данная процедура предусматривает набор всех возможных уравнений регрессии, которые включают потенциальные независимые факторы. Аналитик проводит анализ уравнения, которое не содержит ни одной независимой переменной и исследует все возможные комбинации содержащие независимые переменные [42]. В данной процедуре могут быть использованы различные критерии, однако самым основным является коэффициент детерминации, описывающий, какое количество случае описывает построенная модель прогнозирования. Сначала строится уравнение регрессии для исходной зависимой переменной, фактору, который будет подвержен прогнозированию, и всех возможных независимых факторов, поскольку каждая из независимых переменных имеет два исхода: исход, когда она присутствует, то есть положительный и отрицательный, когда она отсутствует в уравнении. Тогда количество возможных уравнений, которое может быть составлено, будет представлено в общем виде 2K, где K - число независимых переменных, участвующих в модели. Далее требуется сгруппировать все уравнения в соответствии с количеством параметров, которые необходимо подвергнуть оценке [33]. В случае если у нас будет взяты три переменные, то группировка будет произведена следующим образом:

Таблица 3 - Пример группировки моделей по количеству параметров[41]

Независимые переменные

Число параметров

R2

1

2

3

1

2

3

Нет

1

0

X1

2

0,456

X2

2

0,637

X3

2

0,03

X1, X2

3

0,69

X1, X3

3

0,53

X2, X3

3

0,65

X1, X2, X3

4

0,74

Далее требуется выбрать наилучшее сочетание переменных, то есть то которое даст наибольший коэффициент детерминации из тех уравнений, содержащих аналогичное количество параметров. Следующий шаг можно представить в виде условной таблицы:

Таблица 4 - Пример группировки лучших уравнений регрессии[28, c 34]

Число параметров

Независимые переменные

R2

1

Нет

0

2

X2

0,637

3

X1, X2

0,69

4

X1, X2, X3

0,74

Четвертый этап требует субъективной оценки, для того чтобы определить лучшее из представленных в Таблице№4 уравнений регрессии. Поскольку критерием выбора будет необязательно коэффициент детерминации, а наиболее простое уравнение, которое в тоже время не сильно будет уступать максимальному значению коэффициента детерминации из встречающихся в группировки лучших уравнений регрессии.

Процедура пошаговой регрессии представляет собой постепенное добавление в модель прогнозирование, то есть в уравнение регрессии независимых факторов, по одному на каждом отдельном этапе. Для проведения пошаговой регрессии требуется выполнение следующих алгоритмов:

- На первом этапе пошаговой регрессии будут рассматриваться все простые модели. Независимый фактор, который объясняет значимую долю изменчивости исследуемого зависимого фактора и будет первая переменная, включенная в уравнение регрессии.

- Следующая переменная, которая будет добавлена в список независимых факторов уравнения регрессии будет та, которая добавляет наиболее значительную долю в регрессионную сумму квадратов. Для определения значимости вклада используется F-статистика, показывающая значение, которое должно быть превышено для признания переменной значимой для включения.

- После добавления в уравнение второй переменной, отдельный вклад, который вносит каждая переменная в регрессионную сумму квадратов, уже включенных в модель переменных проверяется с помощью F-теста. Если результат тест покажет величину ниже, чем значение для исключения, то данная переменная удаляется из регрессии.

- Этапы 2 и 3 повторяются пока вводимые в модель независимые переменные не перестанут быть значимыми для модели, в момент, когда такие переменные исчерпаны, процедура пошаговой регрессии считается завершенной.

Пока не будет получено подтверждение, что выбранная модель регрессии адекватно может представить данные, регрессионный анализ не может считаться завершенным [27]. Причем получение сведений о модели прогнозирование, о ее возможности верно оценивать данные должны быть проверено до того, как данная модель будет включена в методику принятия решений в условиях неопределенности.

Исследование остатков прогноза является важным этапом в процессе определения репрезентативности модели. В случае если модель имеет дело с данными временных рядов, то необходимо провести соответствующую проверку остатков на отсутствие автокорреляции между ними. Выводы или решения основанием для которых стали результаты прогнозирования уравнением, которые не удовлетворяют основополагающим регрессионным предположениям могут быть совершенно неверными [25]. Крайние наблюдения в наборе данных называются выбросами, то есть такие значения, которые существенно отклоняются от динамики остальных данных. В процессе сглаживания или подгонки выбросы не могут достаточно просто быть определены, однако они оказывают значительное влияние при принятии решения о выборе подходящего уравнения регрессии. Также присутствует необходимость изучения всех выбросов с целью определения необходимости их присутствия в наборе данных или их требуется исключить из него. В случае, когда принято решение об оставлении остатков в наборе данных необходимо определить степень их влияния на уравнение регрессии.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.