Разработка программного модуля на языке VBA для вычисления и проверки статистической значимости коэффициента корреляции для двух выборок, извлеченных из различных генеральных совокупностей, распределенных по нормальному закону
Описание экономического объекта и постановка задачи. Метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. Структура данных и программного обеспечения. Алгоритмы, тестирование программного обеспечения.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 11.11.2014 |
Размер файла | 328,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
1. ОПИСАНИЕ ЭКОНОМИЧЕСКОГО ОБЪЕКТА И ПОСТАНОВКА ЗАДАЧИ
2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ И МЕТОД АНАЛИЗА
3. РАЗРАБОТКА ВХОДНЫХ И ВЫХОДНЫХ ФОРМ
4. СТРУКТУРА ДАННЫХ И ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
5. РАЗРАБОТКА АЛГОРИТМОВ. ТЕСТИРОВАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ВВЕДЕНИЕ
Корреляционная связь -- это зависимость среднего значения результативного признака от изменения факторного признака; в то время как каждому отдельному значению факторного признака Х может соответствовать множество различных значений результативного(Y).
Очень важно понимать суть изучаемой связи, поскольку корреляционная связь может возникнуть между двумя следствиями общей причины. Здесь можно привести множество примеров. Так, классическим является пример, приведенный известным статистиком начала XX в. А.А.Чупровым. Если в качестве признака Х взять число пожарных команд в городе, а за признак Y -- сумму убытков в городе от пожаров, то между признаками Х и Y в городах обнаружится значительная прямая корреляция. В среднем, чем больше пожарников в городе, тем больше убытков от пожаров. В чем же дело? Данную корреляцию нельзя интерпретировать как связь причины и следствия, оба признака- следствия общей причины- размера города. В крупных городах больше пожарных частей, но больше и пожаров, и убытков от них за год, чем в мелких.
Темой данной курсовой работы является «Разработка программного модуля на языке VBA для вычисления и проверки статистической значимости коэффициента корреляции для двух выборок, извлеченных из различных генеральных совокупностей, распределенных по нормальному закону». В данной курсовой работе будет разработан программный модуль на языке Visual Basic for Applications для вычисления и проверки статистической значимости коэффициента корреляции для двух выборок.
Целью данной курсовой работы является теоретическое изучение проверки статистической значимости коэффициента корреляции.
В процессе подготовки курсовой работы решались следующие задачи:
- исследование литературных и интернет-источников по теме курсовой работы;
- теоретическое исследование математических формул применяемых при расчетах и проверки значимости коэффициента корреляции;
- изучение операторов VBA необходимых для разработки программного модуля;
- разработка программного модуля средствами VBA для вычисления и проверки статистической значимости коэффициента корреляции;
- формулирование выводов и предложений по результатам работы.
При подготовке работы использовались различные литературные источники отечественных и зарубежных авторов, интернет-источники.
1. ОПИСАНИЕ ЭКОНОМИЧЕСКОГО ОБЪЕКТА И ПОСТАНОВКА ЗАДАЧИ
Корреляция
Статистическая связь двух переменных (количественных или порядковых), показывающая, что большему значению одной величины в определенной части случаев соответствует большее (в случае положительной, прямой корреляции) или меньшее (в случае отрицательной, обратной корреляции) значение другой величины.
Задачами корреляционного анализа являются:
1) изучение степени тесноты связи2 и более явлений;
2) отбор факторов, оказывающих наиболее существенное влияние на результативный признак;
3) выявление неизвестных причинных связей. Исследование корреляционных зависимостей включает
ряд этапов:
1) предварительный анализ свойств совокупности;
2) установление факта наличия связи, определение ее направления и формы;
3) измерение степени тесноты связи между признаками;
4) построение регрессионной модели, т. е. нахождение аналитического выражения связи;
5) оценку адекватности модели, ее экономическую интерпретацию и практическое использование.
Корреляционная связь между признаками может возникать различными путями. Важнейший путь-причинная зависимость результативного признака (его вариации) от вариации факторного признака.
Например, Х-- балл оценки плодородия почв, Y -- урожайность сельскохозяйственной культуры. Здесь ясно, какой признак выступает как независимая переменная (фактор), а какой как зависимая переменная (результат). экономический статистический корреляция
Корреляция возникает и в случае, когда каждый из признаков и причина, и следствие. Например, при сдельной оплате труда существует корреляция между производительностью труда и заработком. С одной стороны, чем выше производительность труда, тем выше заработок. С другой-- высокий заработок сам по себе является стимулирующим фактором, заставляющим работника трудиться более интенсивно.
По направлению выделяют связь прямую и обратную, по аналитическому выражению-- прямолинейную и нелинейную.
В начальной стадии анализа статистических данных не всегда требуются количественные оценки, достаточно лишь определить направление и характер связи, выявить форму воздействия одних факторов на другие. Для этих целей применяются методы приведения параллельных данных, аналитических группировок и графический.
2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ И МЕТОД АНАЛИЗА
Пусть , ,…,- выборка из n наблюдений пары переменных .
Выборочный коэффициент корреляции r определяется как
(1.1)
где,- выборочные средние, определяющиеся следующим образом:
(1.2)
(1.3)
Свойства коэффициента корреляции r
r изменяется в интервале от -1 до +1.
Знак r означает, увеличивается ли одна переменная по мере того, как увеличивается другая (положительный r), или уменьшается ли одна переменная по мере того, как увеличивается другая (отрицательный r).
Величина r величина указывает, как близко расположены точки к прямой линии. В частности, если или, то имеется абсолютная (функциональная) корреляция по всем точкам, лежащим на линии (практически это маловероятно); если , то линейной корреляции нет (хотя может быть нелинейное соотношение). Чем ближе r к крайним точкам , тем больше степень линейной связи.
Коэффициент корреляции r безразмерен, т. е. не имеет единиц измерения.
Величина r обоснована только в диапазоне значений x и y в выборке. Нельзя заключить, что он будет иметь ту же величину при рассмотрении значений x или y, которые значительно больше, чем их значения в выборке.
x и y могут взаимозаменяться, не влияя на величину r .
Корреляция между x и у не обязательно означает соотношение причины и следствия.представляет собой долю вариабельности у, которая обусловлена линейным соотношением с x.
Выборочный коэффициент корреляции
Пусть, , - набор значений двух факторов на выборке объёма n.
Коэффициент корреляции, подсчитанный таким образом, называется коэффициентом корреляции Пирсона.
Корреляционный анализ
Метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными.
При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков для установления между ними статистических взаимосвязей.
Корреляционный анализ применяется только для анализа связи количественных и/или качественных порядковых признаков.
Оценка достоверности коэффициента корреляции.
Коэффициент парной корреляции, исчисленный по выборочным данным, является случайной величиной. С уменьшением числа наблюдений надежность коэффициента корреляции падает. С увеличением числа наблюдений(свыше500) распределение коэффициента корреляции r (не превышающее 0,9) стремится к нормальному.
Полученный из выборки коэффициент корреляции r является оценкой коэффициента корреляции с в генеральной совокупности.
Значимость коэффициента корреляции можно проверить с помощью статистики , имеющей распределение Стьюдента с степенями свободы.
Расчетное значение вычисляется как
, (1.6)
Критическое значение определяется по таблице распределения Стьюдента (приложение5) по уровню значимости и числу степеней свободы
По общему правилу проверки статистических гипотез:
-- если , нулевую гипотезу о том, что между Х и Y отсутствует корреляционная связь , нельзя отклонить на заданном уровне значимости ;
-- если , нулевая гипотеза отклоняется в пользу альтернативной о том, что коэффициент корреляции значимо отличается от нуля ,т. е. о наличии линейной корреляционной зависимости между Х и Y.
Критерий подчиняется закону распределения Стьюдента с степенями свободы.
Определим доверительный интервал для оценки истинного значения коэффициента корреляции в генеральной совокупности(с)
, (1.4)
где -- среднеквадратическая ошибка выборочного коэффициента парной корреляции;
, (1.5)
-- распределение Стьюдента с числом степеней свободы и уровнем значимости , .
3. РАЗРАБОТКА ВХОДНЫХ И ВЫХОДНЫХ ФОРМ
При разработке данного программного модуля использовались следующие входные и выходные формы:
1) Начальная форма при входе в программу представлена на рисунке 1 На форме расположены командная кнопка «Корреляции» (CommandButton1) и командная кнопка «Очистить» (CommandButton2).
Рисунок 1 - начальная форма при входе в программу
2) Входная форма, открывающаяся при нажатии кнопки «Корреляции» представлена на рисунке 2 пользовательской формой «Ввод исходных данных» (UserForm1).
Рисунок 2 - входная форма.
3) Выходные формы представлены с помощью диалоговых окон функцией MsgBox и в виде соответствующих им таблиц, выводящей данные на лист Excel (рисунок 3 и рисунок 4)
Рисунок 3 - функция MsgBox- доверительного интервала
Рисунок 4 - итоговая таблица
4. СТРУКТУРА ДАННЫХ И ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
В разработанном программном модуле на языке VBA для вычисления и проверки статистической значимости коэффициента корреляции для двух выборок, извлеченных из различных генеральных совокупностей, распределенных по нормальному закону используются функция вызова (UserForm_.Show) и функция закрытия (Unload Me) пользовательских форм:
Private Sub CommandButton1_Click()
UserForm1.Show
End Sub
Private Sub CommandButton5_Click()
Unload Me
End Sub
Следующая подпрограмма обеспечивает ввод количество случайных чисел для двух выборок:
Private Sub TextBox1_Change()
n = TextBox1.Text
Worksheets(1).Cells(1, 5).Value = n
End Sub
При написании подпрограммы на командную кнопку для расчета генерации случайных чисел по первой выборке, распределенных по нормальному закону используется следующая подпрограмма:
Private Sub CommandButton1_Click()
'объявляем переменные
Dim lRundNum, lMinNum, lMaxNum, kol, x, i As Double
' Присваивание входящих значений
x = 2
kol = TextBox1.Text
lMinNum = TextBox2.Text: lMaxNum = TextBox3.Text
Worksheets(1).Cells(1, 1) = "X"
'MsgBox "Ввод 1 множества"
'Генерация случайных значений и запись в ячейки
Do While i < kol 'Начало цикла
'Вызов рандома
Randomize
lRundNum = Int(lMinNum + (Rnd() * lMaxNum))
Cells(x, 1) = lRundNum ' Запись в ячейку
x = x + 1 'Увеличение ячеки на одну позицию
i = i + 1 'Увеличение шага на единицу
Loop
End Sub
При написании подпрограммы на командную кнопку для расчета генерации случайных чисел по второй выборке, распределенных по нормальному закону используется следующая подпрограмма:
Private Sub CommandButton2_Click()
'объявляем переменные
Dim lRundNum, lMinNum, lMaxNum, kol, x, i As Double
' Присваивание входящих значений
x = 2
kol = TextBox1.Text
lMinNum = TextBox6.Text: lMaxNum = TextBox7.Text
Worksheets(1).Cells(1, 2) = "Y"
'MsgBox "Ввод 2 множества"
'Генерация случайных значений и запись в ячейки
Do While i < kol 'Начало цикла
'Вызов рандома
Randomize
lRundNum = Int(lMinNum + (Rnd() * lMaxNum))
Cells(x, 2) = lRundNum ' Запись в ячейку
x = x + 1 'Увеличение ячеки на одну позицию
i = i + 1 'Увеличение шага на единицу
Loop
End Sub
При написании подпрограммы на командную кнопку для вычисления и проверки статистической значимости коэффициента корреляции используется следующая подпрограмма:
Private Sub CommandButton3_Click()
Dim n As Integer
Dim x As Double
Dim y As Double
Dim Sumx As Double
Dim Sumy As Double
Dim xsr As Double
Dim ysr As Double
Dim chisl As Double
Dim zn1 As Double
Dim zn2 As Double
Dim koeff As Double
n = TextBox1.Value
Sumx = 0
For i = 1 To n
x = Cells(i + 1, 1).Value
Sumx = Sumx + x
Next i
xsr = Sumx / n
Sumy = 0
For i = 1 To n
y = Cells(i + 1, 2).Value
Sumy = Sumy + y
Next i
ysr = Sumy / n
chisl = 0
For i = 1 To n
chisl = chisl + (Worksheets(1).Cells(i + 1, 1).Value - xsr) * (Worksheets(1).Cells(i + 1, 2).Value - ysr)
Next i
For i = 1 To n
zn1 = zn1 + (CDbl(Worksheets(1).Cells(i + 1, 1).Value) - xsr) ^ 2
Next i
zn1 = zn1 ^ (1 / 2)
For i = 1 To n
zn2 = zn2 + (CDbl(Worksheets(1).Cells(i + 1, 2).Value) - ysr) ^ 2
Next i
zn2 = zn2 ^ (1 / 2)
koeff = chisl / (zn1 * zn2)
Worksheets(1).Cells(2, 5).Value = koeff
TextBox8.Value = koeff
End Sub
Private Sub CommandButton4_Click()
Dim n As Integer
Dim znachim As Double
n = TextBox1.Value
znachim = CDbl((Cells(2, 5) * Sqr(Cells(1, 5) - 2)) / (Sqr(1 - (Cells(2, 5) ^ 2))))
Worksheets(1).Cells(3, 5).Value = znachim
TextBox9.Value = znachim
End Sub
При написании подпрограммы на командную кнопку для нахождения двух критических точек (tкр1 и tкр2) используется макрос:
Private Sub CommandButton7_Click()
Range("E4").Select
ActiveCell.FormulaR1C1 = "=TINV(0.05,R[-3]C-1)"
TextBox11.Value = Range("E4")
End Sub
Private Sub CommandButton6_Click()
Range("E5").Select
ActiveCell.FormulaR1C1 = "=TINV(0.01,R[-4]C)"
TextBox10.Value = Range("E5")
End Sub
При написании подпрограммы на элемент управления OptionButton для проверки статистической значимости и критических точек (tкр1 и tкр2) используется следующая подпрограмма:
Private Sub OptionButton2_Click()
If OptionButton2 = True And Cells(3, 5).Value > Cells(4, 5).Value Then
MsgBox ("Нулевая гипотеза отклоняется в пользу альтернативной о том, что коэффициент корреляции значимо отличается от нуля (Н1: r<>0), т. е. о наличии линейной корреляционной зависимости между Х и Y")
Else
MsgBox ("Нулевую гипотезу о том, что между Х и Y (Н0: r = 0), отсутствует корреляционная связь, нельзя отклонить на заданном уровне значимости a")
End If
End Sub
Private Sub OptionButton4_Click()
If OptionButton4 = True And Cells(3, 5).Value > Cells(5, 5).Value Then
MsgBox ("Нулевая гипотеза отклоняется в пользу альтернативной о том, что коэффициент корреляции значимо отличается от нуля (Н1: r<>0), т. е. о наличии линейной корреляционной зависимости между Х и Y")
Else
MsgBox ("Нулевую гипотезу о том, что между Х и Y (Н0: r = 0), отсутствует корреляционная связь, нельзя отклонить на заданном уровне значимости a")
End If
End Sub
При написании подпрограммы на командную кнопку для нахождения доверительного интервала используется следующая подпрограмма:
Private Sub CommandButton8_Click()
Dim Sigm As Double
Dim DovInt1 As Double
Dim DovInt2 As Double
Dim a As Double
Dim b As Double
n = TextBox1.Value
If OptionButton2 = True And Cells(3, 5).Value > Cells(4, 5).Value Or OptionButton4 = True And Cells(3, 5).Value > Cells(5, 5).Value Then
Sigm = CDbl((((1 - Cells(2, 5)) ^ 2) / (n - 2)) ^ (1 / 2))
DovInt1 = Cells(2, 5).Value - Cells(3, 5).Value * Sigm
DovInt2 = Cells(2, 5).Value + Cells(3, 5).Value * Sigm
a = Int(DovInt1 * 100) / 100
b = Int(DovInt2 * 100) / 100
If a < -1 Then
a = -1
End If
If b > 1 Then
b = 1
End If
MsgBox (a & " <= ro <= " & b),, ("Доверительный интервал")
End If
End Sub
К кнопке управления (CommandButton2 - «Очистить»), находящаяся на листе Excel, привязана следующие подпрограмма:
Private Sub CommandButton2_Click()
n = Worksheets(1).Cells(1, 5).Value
For i = 1 To n
Worksheets(1).Cells(i + 1, 1).Value = ""
Worksheets(1).Cells(i + 1, 2).Value = ""
Next i
Worksheets(1).Cells(1, 5).Value = ""
Worksheets(1).Cells(2, 5).Value = ""
Worksheets(1).Cells(3, 5).Value = ""
Worksheets(1).Cells(4, 5).Value = ""
Worksheets(1).Cells(5, 5).Value = ""
End Sub
5. РАЗРАБОТКА АЛГОРИТМОВ. ТЕСТИРОВАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
Алгоритм программного модуля на языке VBA для вычисления и проверки статистической значимости коэффициента корреляции для двух выборок, извлеченных из различных генеральных совокупностей, распределенных по нормальному закону представлен на рисунке
Вычисления коэффициента корреляции.
ТЕСТИРОВАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
Для тестирования разработанного модуля на языке VBA вычисления и проверки статистической значимости коэффициента корреляции для двух выборок, извлеченных из различных генеральных совокупностей, распределенных по нормальному закону.
Для тестирования программы используется встроенная функция excel для вычисления коэффициента корреляции по двум выборкам (КОРРЕЛ(А2:А251;В2:В251))
Рисунок 5- Вычисление коэффициента корреляции встроенной функцией Excel
Для тестирования программы используется формула вычисления корреляции в excel используется формула (=(F2*КОРЕНЬ(E1-2))/(КОРЕНЬ(1-(F2^2))))
ЗАКЛЮЧЕНИЕ
В данной курсовой работе был разработан программный модуль на языке Visual Basic for Applications для вычисления и проверки статистической значимости коэффициента корреляции для двух выборок, извлеченных из различных генеральных совокупностей, распределенных по нормальному закону.
Результатом данной курсовой работы является изучение понятия корреляционной связи между двумя случайными величинами, вычисление и проверка статистической значимости коэффициента линейной корреляции.
СПИСОК ЛИТЕРАТУРЫ
1. Васильев А. VBA в Office 2000: Учебный курс/ А. Васильев, А. Андреев. - СПб: Питер, 2011. - 432с.
2. Ниворожкина, Л. П., Морозова3. А., Герасимова И. А., Житников И. В. Основы статистики с элементами теории вероятностей для экономистов: Руководство для решения задач. -- Ростов н/Д: Феникс, 1999. -- 320 с. -- (Учебники «Феникса»).
3. Гмурман, В.Е. теория вероятности и математической статистике: Учебное пособие для студентов вузов.
Размещено на Allbest.ru
Подобные документы
Расчет коэффициентов корреляции Пирсона и ранговой корреляции Спирмена по регионам Российской Федерации для заданных показателей. Построение линейной и нелинейной (квадратической) модели регрессии. Проведение проверки значимости для полученных данных.
контрольная работа [464,0 K], добавлен 28.05.2012Классификация показателей тесноты связи. Основные способы расчета показателей и определение их значимости. Линейный коэффициент корреляции для несгруппированных данных. Принятие решений о тесноте связи на основе линейного коэффициента корреляции.
презентация [146,4 K], добавлен 16.03.2014Основные этапы многофакторного корреляционного анализа и интерпретация его параметров. Назначение коэффициентов эластичности и стандартизированных бетта-коэффициентов. Расчет значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента.
контрольная работа [605,2 K], добавлен 29.07.2010Экономические основы создания компании по разработке программного обеспечения в сфере бизнес-планирования. Описание отрасли программного обеспечения и рынка сбыта. Оценка экономической эффективности бизнес-плана. Маркетинговый и производственный планы.
бизнес-план [222,8 K], добавлен 15.03.2015Расчёт трудоемкости разработки программного обеспечения, исходя из структуры времени на создание программного продукта, квалификации программиста. Расчёт затрат на оплату труда, амортизацию, комплектующие, электроэнергию. Цена интеллектуального труда.
курсовая работа [114,5 K], добавлен 27.11.2013Построение корреляционного поля и предложение гипотезы о связи между денежными доходами и потребительскими расходами, выдвижение предположения о наличии выбросов. Оценка статистической надежности и значимости вычисленного коэффициента корреляции.
контрольная работа [3,0 M], добавлен 15.11.2012Теоретические основы функционирования компаний-разработчиков программного обеспечения на рынке Беларуси. Анализ способов их эффективного функционирования в период экономического кризиса. Государственное содействие развитию высоких технологий в РБ.
дипломная работа [1,5 M], добавлен 25.06.2010Коэффициент корреляции, его значение и основные характеристики. Связь между двумя переменными. Динамика уровней ряда. Исследование временного ряда. Последовательность коэффициентов автокорреляции уровней первого, второго и последующих порядков.
курсовая работа [295,7 K], добавлен 06.05.2015Назначение рангового коэффициента корреляции, определение силы и направления корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков. Графическое представление метода ранговой корреляции, расчет эмпирического значения rs.
презентация [46,5 K], добавлен 12.11.2010Средние статистические величины и аналитическая группировка данных предприятия. Результаты расчета коэффициента Фехнера по цехам. Измерение степени тесноты связи в статистике с помощью показателя корреляции. Поля корреляции и уравнения регрессии для цеха.
практическая работа [495,9 K], добавлен 26.11.2012