Стратифікований випадковий відбір
Дослідження стратифікованого випадкового відбору та його порівняння з простим випадковим відбором. Оцінювання дисперсії та довірчі межі для середнього та сумарного значення популяції. Порівняння точності стратифікованого та простого випадкового відбору.
Рубрика | Математика |
Вид | дипломная работа |
Язык | украинский |
Дата добавления | 12.08.2010 |
Размер файла | 3,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
83
Міністерство освіти і науки України
Дніпропетровський національний університет ім.О. Гончара
Дипломна бакалаврська робота
Стратифікований випадковий відбір
Виконавець:
студентка групи
МС-06-1 __________________ Горбатюк А.В.
"__"________2010р.
Керівник роботи:
__________________
"__"________2010р.
Рецензент:
__________________ "__"________2010р.
Допуск до захисту:
__________________
"__"________2010р.
Дніпропетровськ 2010
Реферат
Дипломна бакалаврська робота: 74 сторінки, 6 джерел, 6 таблиць, 9 рисунків.
Перелік ключових слів: вибірка, популяція, страта, простий випадковий відбір, стратифікований випадковий відбір, дисперсія, стратифікація з пропорційним розміщенням, стратифікація з оптимальним розміщенням.
Об'єкт дослідження: стратифікований випадковий відбір.
Мета роботи: дослідження стратифікованого випадкового відбору та його порівняння з простим випадковим відбором.
Зміст
- Вступ
- Розділ І. Стратифікований випадковий відбір
- 1.1 Властивості оцінок
- 1.2 Оцінювання дисперсії та довірчі межі для середнього значення та сумарного значення популяції
- 1.3 Оптимальне розміщення
- 1.4 Порівняльна точність стратифікованого випадкового відбору та простого випадкового відбору
- 1.5 Визначення обсягу вибірки у випадку неперервних змінних
- 1.5.1 Оцінювання середнього значення популяції
- 1.5.2 Оцінювання сумарного значення популяції
- 1.6 Стратифікований відбір для оцінювання часток
- 1.7 Визначення обсягу вибірки при оцінюванні часток
- 1.8 Приклади розв'язання задач
- Розділ ІІ. Порівняння точності стратифікованого та простого випадкового відбору
- 2.1 Опис гіпотетичного міста StatVillage
- 2.2 Постановка задачі
- 2.3 Розв'язання поставленої задачі
- 2.3.1 Розрахунок характеристик для популяції
- 2.3.2 Визначення обсягів вибірок для кожної страти
- 2.3.3 Використання програми Maple 8.0 для відбору одиниць вибірок
- 2.3.4 Здобуття вибірок домогосподарств гіпотетичного міста StatVillage
- 2.3.5 Дисперсії оцінок
- 2.4 Порівняння стратифікованого випадкового відбору з простим випадковим відбором
- Висновки
- Список використаних джерел
- Додатки
Вступ
Досить часто на практиці при проведенні вибіркового обстеження доступна деяка додаткова інформація щодо популяції, яка досліджується. Наприклад, відомо, що для деяких підмножин (субпопуляцій) середнє значення величини, яка цікавить дослідника, суттєво різняться. У такому випадку можливо дістати більш точні оцінки величини, що характеризує популяцію, за допомогою використання стратифікованого випадкового відбору.
При стратифікованому відборі популяція, що містить N одиниць, спочатку поділяється на субпопуляції (підпопуляції), що складаються відповідно з N1, N2,..., NL одиниць. Ці підпопуляції не містять спільних одиниць і разом вичерпують усю популяцію, так що
N1 + N2 +... + NL = N.
Такі підпопуляції називають стратами. Для того, щоб можна було повністю скористатися вигодами від стратифікації, значення N1, N2,…, NL повинні бути відомі. За визначених страт, вибірка добувається з кожної страти, при цьому відбір у різних стратах відбувається незалежно. Обсяги вибірок всередині страт позначаються відповідно через n1,n2,..., nL.
Якщо у кожній страті добувають просту випадкову вибірку, то спосіб відбору в цілому називається стратифікованим випадковим відбором (див рис.1).
Стратифікація є досить розповсюдженим методом. Це зумовлено багатьма причинами; наведемо основні з них.
1. Якщо бажано одержати з певною точністю дані про деякі підпопуляції популяції, то кожну таку підпопуляцію рекомендуєтся розглядати на правах самостійної "популяції".
2. Застосування стратифікації може бути продиктоване организаційними міркуваннями, наприклад, агентство, що здійснює вибіркове обстеження, може мати районні відділи, кожний з яких забеспечує проведення вибіркового обстеження деякої частини популяції.
3. Проблеми, пов'язані з відбором у різних частинах популяції, суттєво різняться. При вибіркових обстеженнях осіб, що перебувають у таких закладах, як готелі, лікарні, в'язниці, часто виділяють в окрему страту на відміну від осіб, що мешкають у звичайних будинках, оскільки до відбору в цих двох випадках необхідний різний підхід. При вибірковому обстеженні, розпочатому з метою вивчення ділової активності, ми можемо скласти список великих фірм, виокремивши їх в окрему страту. Для більш дрібних фірм можна застосувати один з видів територіального відбору.
4. Стратифікація дає виграш у точності при оцінюванні характеристик усієї популяції. Іноді неоднорідну популяцію вдається розділити на підпопуляції, кожна з яких внутрішньо однорідна. Якщо кожна страта однорідна в тому сенсі, що результати вимірювань в ній досить мало змінюются від одиниці до одиниці, то можна одержати точну оцінку середнього значення для будь-якої страти за невеликою вибіркою в цій страті. Далі ці оцінки можна об'єднати в одну точну оцінку для всієї популяції.
У теорії стратифікаційного відбору розглядаються властивості оцінок, знайдених за стратифікованими вибірками, та умови визначення найкращих обсягів вибірки за стратами, nh, для отримання максимальної точності. Передбачається, що самі страти вже створені.
Для найбільш повного використання потенційних можливостей техніки стратифікованого випадкового обстеження необхідно розв'язати деякі практичні питання побудови стратифікованої вибірки. Перша проблема полягає у поділі всієї популяції на страти, а друга - у виборі методу отримання випадкової вибірки і методу оцінювання для кожної страти.
Введемо наступні позначення. Індекси h та i відповідають номеру страти та номеру одиниці в страті. Нехай
Nh - загальне число одиниць в страті h;
nh - число одиниць у вибірці зі страти h;
Yh i - значення, отримане для i-ої одиниці популяції в страті h;
yh i - значення, отримане для i-ої одиниці вибірки зі страти h;
- вага страти h;
- частка відбору в страті h;
- середнє значення змінної Y популяції в страті h;
-вибіркове середнє значення змінної y в страті h;
- дисперсія змінної Y в страті h популяції.
Відмітимо, що у знаменнику оцінки дисперсії стоїть (Nh - 1).
В роботі ставиться задача порівняння стратифікованого випадкового відбору при пропорційному та при оптимальному розміщенні з простим випадковим відбором на прикладі вибіркового обстеження домогосподарств гіпотетичного міста StatVillage.
Розділ І. Стратифікований випадковий відбір
1.1 Властивості оцінок
При простому випадковому відборі вибіркове середнє є незміщеною оцінкою середнього значення популяції. За оцінку середнього значення
для популяції при стратифікованому відборі використовується (st - від англ. "stratified"):
, (1.1.1)
де N = N1 + N2 +... + NL.
Оцінка , взагалі кажучи, не збігається з вибірковим середнім
(1.1.2)
Відмінність полягає у тому, що в оцінкам , отриманим по окремим стратам, надаються їхні правильні ваги Nh/N. Очевидно, що збігається з за умов, що для кожної страти
або або . (1.1.3)
Останнє означає, що частка відбору fh однакова для всіх страт. Така стратифікація називається стратифікацією з пропорційним розміщенням nh. Вона забезпечує рівнозважену вибірку. Якщо необхідно обчислювати багаточисельні оцінки, то рівнозважена вибірка дає економію часу.
Основні властивості оцінки викладені у наступних теоремах.
Зауваження. Перші дві теореми відносяться до стратифікованого відбору в цілому, а не тільки до стратифікованого випадкового відбору; іншими словами, вибірка з кожної страти не обов'язково повинна бути простою випадковою вибіркою.
Теорема 1.1.1 Якщо для кожної страти вибіркова оцінка є незміщеною оцінкою , то є незміщеною оцінкою середнього значення популяції, , тобто .
Доведення.
Обчислимо математичне сподівання :
,
оскільки оцінки за окремими стратами незміщені (). Середнє значення для популяції можна записати у вигляді
. Отже, .
Теорема доведена.
Наслідок. Оскільки при простому випадковому відборі всередині страт є незміщеними оцінками , то при стратифікованому випадковому відборі буде незміщеною оцінкою .
Теорема 1.1.2 При стратифікованому відборі дисперсія оцінки середнього значення популяції має вигляд:
(1.1.4)
де
Теорему будемо доводити за обмежень:
(a) незміщені оцінки ;
(б) вибірки у різних стратах добуваються незалежно.
Доведення.
Розглянемо помилку оцінки :
(1.1.5)
Відмітимо, що помилка оцінки, , виражена тепер як зважене середнє помилок, набутих при оцінюванні за окремими стратами. Отже,
причому в останньому доданку із правого боку підсумовування розповсюджується на всі пари страт.
Тепер візьмемо середнє за всіма можливими вибірками:
.
Почнемо з того, що для кожного члена із індексами, що не збігаються будемо вважати незмінною вибірку у страті h і візьмемо середнє за всіма вибірками у страті j. Оскільки відбір по цим двом стратам відбувається незалежно, то яку б вибірку у страті h ми б не здобули, можливі вибірки у страті j й відповідні ймовірності будуть тими ж самими. Но так як вважається незміщеною оцінкою для , то
.
Тому, усі члени з індексами, що не збігаються, зникають.
Отже,
Теорема доведена.
Важлива особливість цього результату полягає в тому, що дисперсія залежить тільки від дисперсій оцінок середніх для окремих страт. Якщо б популяцію з великою варіацією значень можна було б поділити на страти так, щоб всередині кожної страти усі одиниці мали однакові значення ознаки, то ми би були в змозі оцінити без помилки. Як показує рівність (1.4), до такого результату приводить використання правильних ваг Nh/N при побудові оцінки .
Теорема 1.1.3 При стратифікованому випадковому відборі дисперсія оцінки має вигляд
. (1.1.6)
Доведення.
Оскільки є незміщеною оцінкою , то можна застосувати теорему 1.1.2 Крім того, дисперсія вибіркового середнього для простої випадкової вибірки дорівнює:
.
Підставляючи у (1.1.4), отримаємо
.
Деякі частинні випадки цієї формули наведені у наслідках 1.1.1, 1.1.2, 1.1.3. Наслідок 1.1.1 Якщо частки відбору nh /Nh дуже малі в усіх стратах, то
(1.1.7)
Дійсно,
Оскільки за припущенням nh /Nh дуже малі, то
.
Цю формулу застосовують у тих випадках, коли можна знехтувати поправками на скінченність популяції.
Наслідок 1.1.2 Для стратифікованої вибірки з пропорційним розміщенням
дисперсія набуває вигляду
(1.1.8)
Доведення.
.
Наслідок 1.1.3 Для стратифікованої вибірки з пропорційним розміщенням nh та однаковою дисперсією отримаємо простий результат
(1.1.9)
Теорема 1.1.4 Якщо - це оцінка сумарного значення для популяції
,
тоді
. (1.1.10)
Приклад.
У таблиці 1.1.1 наведені дані 1920 і 1930 рр. відносно кількості мешканців 64 великих міст США (у тисячах). Ці міста у загальному списку міст США, впорядкованому за кількістю мешканців у 1920 р. займали місця з п'ятого по шістдесят восьме. Міста поділені на дві страти, перша з яких містить 16 більш великих міст, а друга - інші 48 міст.
Сумарну кількість мешканців усіх 64 міст у 1930 р. необхідно оцінити за вибіркою, що складається із 24 міст. Знайдемо стандартну похибку оцінки сумарного числа для:
простої випадкової вибірки, ;
стратифікованої випадкової вибірки з пропорційним розміщенням, ;
стратифікованої випадкової вибірки, що містить 12 одиниць із кожної страти, .
Дана популяція схожа на популяції підприємств та установ у тому сенсі, що значення ознаки у деяких одиниць - у даному прикладі числа мешканців великих міст - складає значну частину сумарного значення і має значно більші коливання, ніж у інших. Сумарні значення для страт і суми квадратів наведені у таблиці 1.1.2 У даному прикладі користуємось лише значеннями за 1930 рік.
Таблиця 1.1 1. Величини 64 міст США у 1920 і 1930 рр.
Величина міст у 1920 р. (xhi) |
Величина міст у 1930 р. (yhi) |
|||||||
Страта h |
Страта h |
|||||||
1 |
2 |
1 |
2 |
|||||
797 773 748 734 588 577 507 507 457 438 415 401 387 381 324 315 |
314 298 296 258 256 243 238 237 235 235 216 208 201 192 180 179 |
172 172 163 162 161 159 153 144 138 138 138 138 136 132 130 126 |
121 120 119 118 118 116 116 113 113 110 110 108 106 104 101 100 |
900 822 781 805 670 1238 573 634 578 487 442 451 459 464 400 366 |
364 317 328 302 288 291 253 291 308 272 284 255 270 214 195 260 |
209 183 163 253 232 260 201 147 292 164 143 169 139 170 150 143 |
113 115 123 154 140 119 130 127 100 107 114 111 163 116 122 134 |
Таблиця 1.1 2. Сумарні значення і суми квадратів
1920 р. |
1930 р. |
||||
Страта |
|||||
1 2 |
8349 7941 |
4756619 1474871 |
10070 9498 |
7145450 2141720 |
Для всієї популяції 64 міст в 1930 р. маємо:
сумарне число жителів
,
середнє число жителів
дисперсія числа жителів
Для простого випадкового відбору маємо
n = 24
і є оцінкою для .
Оцінка сумарного числа жителів дорівнює
і є оцінкою для Y. Дисперсія сумарного числа жителів дорівнює:
Стандартна похибка оцінки сумарного числа жителів:
Для стратифікованого відбору з пропорційним розміщенням nh маємо:
n1 = 6 міст, n2 = 18 міст.
Відібравши за допомогою простого випадкового відбору 6 міст з 16 великих міст і 18 міст із 48 інших міст маємо
за першою вибіркою:
за другою вибіркою:
тоді
Оцінка сумарного числа жителів дорівнює
Для обчислення дисперсії оцінки сумарного числа жителів необхідно знати середнє число жителів в 1 страті
середнє число жителів в 2 страті
Для стратифікованого відбору з рівними nh маємо
n1 = 12 міст, n2 = 12 міст.
Відібравши за допомогою простого випадкового відбору по 12 міст з 16 великих і з 48 інших міст маємо
за першою вибіркою:
за другою вибіркою:
тоді
є оцінкою для .
Оцінка сумарного числа жителів дорівнює
Дисперсія сумарного числа жителів дорівнює:
Стандартна похибка оцінки сумарного числа жителів:
1.2 Оцінювання дисперсії та довірчі межі для середнього значення та сумарного значення популяції
Нехай у кожній страті добувається проста випадкова вибірка, тоді незміщеною оцінкою дисперсії страти h є
, (1.2.1)
тобто
.
Теорема 1.2.1 При стратифікаційному випадковому відборі незміщеною оцінкою дисперсії виступає:
(1.2.2)
Інший, зручний для обчислень, вигляд цієї формули
(1.2.3)
Другий член у правій частині рівності характеризує зменшення дисперсії, обумовлене псп.
Для того, щоб знайти цю оцінку, із кожної страти повинні бути добуті принаймні дві одиниці.
Наслідок 1.2.1 У деяких випадках є підстави припускати, що має одне й те ж значення в усіх стратах. Із дисперсійного аналізу вибірки випливає, що об`єднаною (тобто знайденою на основі спостережень в усіх стратах) оцінкою цього спільного значення дисперсії буде
(1.2.4)
Оскільки у таких випадках зазвичай застосовують пропорційний відбір, оцінка дисперсії (згідно із наслідком 1.1.3 теореми 1.1.3) набуває простого вигляду:
(1.2.5)
з (п - L) ступенями вільності. Довірчий інтервал для середнього значення популяції має вигляд:
(1.2.6)
і містить невідоме середнє значення з ймовірністю .
Довірчий інтервал для сумарного значення популяції має вигляд
(1.2.7)
і містить невідоме сумарне значення популяціїз імовірністю.
Наближений метод надання s () ефективного числа ступіней вільності полягає у наступному (Sбtterthwaite, 1946).
Ми можемо записати (1.2.2) у вигляді
, де . (1.2.8)
Ефективне число ступіней вільності пе дорівнює:
(1.2.9)
Величина пе завжди знаходиться між найменшою з величин (nh - 1) та їхньою сумою. Таке наближення враховує той факт, що може змінюватись від страти до страти. Його застосування вимагає припущення про те, що розподілені нормально, оскільки дисперсія прийнята рівною . Якщо розподіл має додатний ексцес, то дисперсія буде більше цієї величини. У цьому випадку, формула (1.2.9) перевищує ефективне число ступенів вільності.
1.3 Оптимальне розміщення
При стратифікаційному відборі обсяги вибірок nh у відповідних стратах визначає дослідник. Їх можна вибирати так, щоб мінімізувати D при визначених витратах C на здобуття вибірки або мінімізувати витрати за визначеної величини D.
Найпростіша функція витрат має вигляд
(1.3.1)
Для кожного страти h витрати пропорційні обсягу вибірки nh, але витрати у розрахунку на одну одиницю, сh, можуть змінюватись від страти до страти. Вільний член c0 відповідає накладним витратам. Така функція виправдана, якщо основну частину витрат складають витрати на вимірювання кожної одиниці. Якщо ж істотну частину витрат складають витрати на пересування від однієї одиниці до іншої, то, як показали практичні й теоретичні дослідження, цим шляховим витратам більше відповідає вираз , де th - шляхові витрати у розрахунку на одиницю. Будемо розглядати тільки лінійну функцію витрат виду (1.3.1).
Теорема 1.3.1 При стратифікованому випадковому відборі з функцією витрат вигляду (1.3.1) дисперсія оцінки середнього значення популяції мінімальна, якщо nh пропорційні .
Доведення. Задача полягає у мінімізації виразу
за умов, що
c1n1 + c2n2 + … + cLnL = С - с0.
Застосовуючи метод множників Лагранжа, виберемо nh і множник л такими, що мінімізують
або, що те ж саме,
.
Продиференціюємо останній вираз за nh і прирівнюємо до нуля:
або, . (1.3.2)
Підсумовуючи по всіх стратах, отримаємо:
, або, (1.3.3)
Остаточно поділивши (3.2) на (3.3) приходимо до
(1.3.4)
Теорема доведена.
Ця теорема задає наступні правила відбору. У даній страті необхідно вибирати вибірку більшого обсягу, якщо:
1) страта більше;
2) у страті більша варіація ознаки;
3) відбір у страті обходиться дешевше.
Для того, щоб завершити розміщення, залишилось зробити ще один крок. Рівняння (1.3.4) вказує nh у частках п, проте ми ще не знаємо, яке значення n обрати. Розв'язання останнього питання залежить від того, чи повинна вибірка забезпечити певні загальні витрати С або певну дисперсію D.
Якщо незмінні витрати, то необхідно підставити оптимальні значення nh
у функцію витрат (1.3.1)
і розв'язати рівняння відносно п. Отримаємо:
(1.3.5)
Якщо незмінна дисперсія D= D, то необхідно підставити оптимальні значення nh
у формулу для D.
Отримаємо:
, де Wh = Nh / N.
Важливий частинний випадок виникає при ch = с, тобто коли витрати у розрахунку на одиницю в усіх стратах однакові.
Загальні витрати набувають вигляду:
С = с0 + сп,
і оптимальне розміщення при незмінних витратах зводиться до оптимального розміщення при незмінному обсязі вибірки. У цьому частинному випадку теорема 1.3.1 набуває наступного вигляду.
Теорема 1.3.2 При стратифікованому випадковому відборі із незмінним загальним обсягом вибірки п дисперсія D мінімальна, якщо
. (1.3.7)
Таке розміщення називають неймановим розміщенням, оскільки воно набуло поширення після роботи Неймана (Neyman, 1934). Як було з'ясовано пізніше, цей результат був отриманий раніше Чупровим (Tschuprow, 1923).
Мінімальне значення дисперсії при незмінному п отримаємо, якщо підставити значення nh з (1.3.7) у загальну формулу для D. У результаті знаходимо:
(1.3.8)
Другий член у правій частині рівності відповідає псп.
Інше доведення твердження про оптимальне розміщення (Stuart, 1954) спирається на нерівність Коші-Буняковського. Мінімізація дисперсії при незмінних витратах С як мінімізація витрат при незмінній дисперсії еквівалентні мінімізації добутку
де
,
оскільки D' і С' є тими частинами D і С, які залежать від nh. Згідно нерівності Коші-Буняковського, якщо ah і bh-два набори додатних чисел, тоді
(1.3.9)
причому рівність має місце тільки тоді, коли співвідношення bh / ah є cталим для усіх h. Нехай
; .
Із нерівності (1.3.9) випливає, що
.
Мінімальне значення D'С' достягається при
,
що узгоджується із теоремою 1.3.1
1.4 Порівняльна точність стратифікованого випадкового відбору та простого випадкового відбору
При раціональному застосуванні стратифікація майже завжди призводить до зменшення дисперсії оцінок середніх або сумарних значень у порівнянні із простою випадковою вибіркою того ж обсягу. Проте не вірно вважати, що будь-яка стратифікована випадкова вибірка дає меньшу дисперсію, ніж проста випадкова вибірка. Якщо значення nh далекі від оптимальних, то стратифікований відбір може дати більшу дисперсію. Насправді при незмінному загальному обсязі вибірки більшу дисперсію може дати навіть стратифікування із оптимальним розміщенням, хоча такий результат має скоріш академічний інтерес, ніж практичне значення.
Порівняємо простий випадковий відбір із стратифікованим випадковим відбором при пропорційному розміщенні та при оптимальному розміщенні . Це порівняння проілюструє, з чого складається виграш, який зявляється при стратифікації. Псп в даному випадку не враховується.
Дисперсії оцінок середніх значень позначаються відповідно через Dran (ran - random) для простого випадкового відбору, Dprop (prop - proportional) для стратифікованого відбору із пропорційним розміщенням і Dopt (opt - optimal) для стратифікованого відбору із оптимальним розміщенням .
Теорема 1.4.1 Якщо знехтувати величинами порядку nh/N, то справедливі нерівності
(1.4 1)
де оптимальне розміщення розглядають при незмінному п, тобто при nh ~ NhSh.
Доведення. Якщо знехтувати псп, то
перетворюється на , (1.4 2)
перетворюється на (1.4 3)
перетворюється на
(1.4 4)
На підставі стандартної тотожності дисперсійного аналізу для стратифікованої популяції маємо
.
(1.4 5)
Оскільки члени порядку 1/Nh досить малі, то рівність можна подати у вигляді:
,
. Тоді,
(1.4 6)
Згідно із означенням повинна виконуватись нерівність:
.
Різниця цих дисперсій дорівнює:
(1.4 7)
де
.
Із (1.4 6) і (1.4 7) маємо:
. (1.4 8)
Із цієї рівності випливає, що якщо ми від простого випадкового відбору переходимо до стратифікованого із оптимальним розміщенням, зменшення дисперсії складається із двох частин. Перша з них (крайній правий член рівності)
має своїм джерелом виключення відмінностей між середніми значеннями для страт; друга (середній член праворуч)
виключення ефекту відмінностей між середніми квадратичними відхиленнями для страт. Цей другий компонент виражає відмінність між дисперсіями при пропорційному і оптимальному розміщенні.
Якщо псп знехтувати не можна, то аналогічні викладки призводять до рівності:
(1.4 9)
Звідси випливає, що дисперсія у випадку стратифікованого відбору із пропорційним розміщенням буде більше, ніж дисперсія при простому випадковому відборі, якщо
(1.4 10)
Теоретично останнє може мати місце. Припустимо, що всі дорівнюють , так що пропорційне розміщення оптимально у сенсі Неймана. Тоді (1.4 10) приймає вигляд
,
або,
.
Остання нерівність вимагає, щоб середній квадрат між стратами був менший, ніж середній квадрат всередині страт.
Теорема доведена.
1.5 Визначення обсягу вибірки у випадку неперервних змінних
У підрозділі 1.2 були наведені формули для визначення п при оптимальному розміщенні вибірки. У цьому підрозділі пропонуються формули для будь-якого виду розміщення та розглядаються деякі особливі випадки.
Припускається, що оцінка має визначену дисперсію D. Якщо замість неї є визначеною похибка оцінки е, то можна скористатися рівністю:
D = (е/t) 2,де t - верхня б/2-границя нормального розподілу з параметрами (0,1).
1.5.1 Оцінювання середнього значення популяції
Нехай sh - оцінка Sh і нехай nh = whn, де wh вже визначені.
Теорема 1.5.1. Незміщена оцінка дисперсії Sh за даними вибірки дорівнює:
Тоді за даних позначень очікуване значення за наведеною вище теоремою дорівнює:
(1.5 1)
де Wh = Nh/N.
Звідси знаходимо загальну формулу для обсягу вибірки п:
(1.5 2)
Якщо N - велике, то за перше наближення для n маємо:
(1.5 3)
Якщо n0 /N знехтувати неможливо, то п можна обчислити за формулою:
(1.5 4)
Для частинних випадків формулу (1.5 2) можна записати у більш зручному для обчислювань вигляді. Наведемо деякі з них.
Імовірно оптимальне розміщення (при незмінному n):
wh ~ Whsh., (1.5 5)
Пропорційне розміщення:
wh = Wh = Nh/N, , (1.5.6)
1.5.2 Оцінювання сумарного значення популяції
Якщо D - очікуване значення D, то основні формули набувають наступного вигляду:
Загальний випадок:
Із теореми 1.1.4 маємо:
Так як
,
то
.
Очікуване значення дорівнює:
.
Підставляємо nh:
.
Тоді
(1.5 7)
Імовірно оптимальне розміщення (при незмінному n):
(1.5 8)
Пропорційне розміщення:
,. (1.5 9)
Приклад.
Цей приклад узятий із праці Корнелла (Cornell, I947), в якій описується вибірка коледжів та університетів США, здобута у 1946 р. Федеральним управлінням просвіти (U. S. Office of Education) для того, щоб оцінити число студентів у 1946-1947 навчальному році. Для ілюстрації розглядається популяція, що містить 196 педагогічних коледжів. Вони були розподілені на сім страт, із яких одна невелика страта не береться до розгляду. Перші п'ять страт створені у відповідності до величини коледжів, шоста містить тільки жіночі коледжі.
Оцінки sh величин Sh, були обчислені за даними 1943-1944 навчального року. Було використано "оптимальне" розміщення.
Необхідно оцінити сумарне число студентів із коефіцієнтом варіації 5%. У 1943г. загальне число студентів для цієї групи коледжів складало 56 472. Таким чином, очікувана стандартна похибка дорівнювала:
0,05 · 56472 = 2824,тому очікувана дисперсія дорівнює:
D = (2824) 2 = 7 974 976.
Можна заперечити, що число студентів у 1946 г. повинно бути більшим, ніж у 1943 р., і що на це треба зробити похибку.
Насправді при розрахунках припускається тільки, що коефіцієнт варіації у розрахунку на коледж однаковий у 1943 і в 1946 рр. - таке припущення є допустимим.
У таблиці 1.5 1 наведені значення Nh, sh і Nhsh, які були відомі до визначення п.
Таблиця 1.5.1 Дані для визначення обсягу вибірки
Страта |
Nh |
sh |
Nh sh |
nh |
|
1 2 3 4 5 6 |
13 18 26 42 73 24 |
325 190 189 82 86 190 |
4 225 3 420 4914 3444 6 278 4 560 |
9 7 10 7 13 10 |
|
Всього |
196 |
26841 |
56 |
Для знаходження п використаємо формулу (1.5 8), яку застосовують при оцінюванні сумарного значення у випадку "оптимального" розміщення.
Коли популяція містить тільки 196 одиниць, псп не можна знехтувати.
Проте для прикладу, знайдемо перше наближення, яке не враховує псп:
.
Очевидно, необхідна поправка.
У якості правильного п на основі формули (1.5 8) отримаємо:
.
Була добута вибірка об'ємом у 56 одиниць. Значення nh для окремих страт наведені у крайньому правому стовпці таблиці 1.5.1.
1.6 Стратифікований відбір для оцінювання часток
Якщо необхідно оцінити долю одиниць популяції, що відносяться до певного визначеного класу С, то ідеальне стратифікування ми отримали б, якщо би були у змозі включити у першу страту всі одиниці із класу С, а в другу - всі інші. Не маючи такої можливості, ми намагаємось розірвати страти таким чином, щоб частка одиниць із класу С змінювалась від страти до страти як можна більше.
Нехай
,
частки одиниць із класу С відповідно у страті h і у вибірці з цієї страти, An - число одиниць класу С в популяції, an - число одиниць класу С у популяції.
Нехай yhi - змінна, яка приймає значення 1, якщо одиниця належить класу С, і значення 0 в іншому випадку. Природною оцінкою частки одиниць для усієї популяції при стратифікованому випадковому відборі буде
(1.6 1)
Теорема 1.6.1. При стратифікованому випадковому відборі дисперсія Dрst дорівнює:
(1.6 2)
Доведення.
Теорема є частинним випадком загальної теореми про дисперсію оцінки середнього значення.
За теоремою 1.3:
.
Було доведено, що для такої змінної
.
Звідси випливає твердження теореми.
Зауваження.
Майже в усіх випадках, навіть якщо не можна знехтувати псп, можна відкинути члени порядку 1/Nh, і тому застосовувати дещо простішу формулу:
(1.6 3)
Наслідок 1.6.1. Якщо псп можна знехтувати, то
(1.6 4)
Наслідок 1.6.2. При пропорційному розміщенні
(1.6 5)
(1.6 6)
Для отримання вибіркової оцінки дисперсії треба у будь-яку з наведених формул підставити phqh/ (nh - I) замість невідомих PhQh/nh.
Мінімальна дисперсія при незмінному загальному обсязі вибірки.
Звідси
(1.6 7)
Мінімальна дисперсія при незмінних витратах, де витрати дорівнюють :
(1.6 8)
Значення п визначається таким же чином, як і в підрозділі 1.2
1.7 Визначення обсягу вибірки при оцінюванні часток
Нехай D - очікуване значення дисперсії при оцінюванні частки Р усієї популяції. Формули для двох основних типів розміщення мають наступний вигляд.
Пропорційне розміщення:
; . (1.7 1)
Імовірно оптимальне розміщення:
; . (1.7 2)
де n0-перше наближення, без урахування псп,
n - уточнене значення, що враховує псп.
При виведенні цих формул множники Nh/ (Nh-1) вважались рівними одиниці.
Отримані результати відносяться до випадку оцінювання частки. Якщо за припущенням ми маємо справу із процентним співвідношенням, то у випадку, коли Ph, Qh, D і т.д. виражені у відсотках, можна застосовувати ті ж формули. При оцінюванні сумарного числа одиниць популяції, що належать до класу С, тобто NP, усі дисперсії множаться на N2.
1.8 Приклади розв'язання задач
1. У популяції із N=6 і L=2 yhi приймають значення 0, 1, 2 для страти 1 і 4, 6, 11 для страти 2. Необхідно добути вибірку обсягом n=4.
а) показати що оптимальні nh, що відповідають нейманову розміщенню, округлені до цілих чисел, будуть n1=1 для страти 1 и n2=3 в страти 2;
б) знайти оцінки для всіх вибірок, які можна отримати при оптимальному та пропорційному розміщенні nh. Знайти і.
в) перевірити, що отримане значення співпадає із значенням, отриманим за формулою:
.
Застосування формули
для знаходження дає не зовсім вірну відповідь, за рахунок округлення до цілих величин nh. На яку величину отримане за цією формулою значення відрізняється від вірного?
Розв'язання.
, N = 6,
а) оптимальні nh,що відповідають нейманову розміщенню знаходять за формулою:
.
, .
б) 1) стратифікований відбір із пропорційним розміщенням nh
n1 = 2, n2 = 2.
Вибірка з 1 страти |
Вибірка з 2 страти |
||||||
0 |
1 |
4 |
6 |
2,75 |
16,5 |
4,06 |
|
0 |
1 |
4 |
11 |
4 |
24 |
4,90 |
|
0 |
1 |
6 |
11 |
4,5 |
27 |
5, 20 |
|
0 |
2 |
4 |
6 |
3 |
18 |
4,24 |
|
0 |
2 |
4 |
11 |
4,25 |
25,5 |
5,05 |
|
0 |
2 |
6 |
11 |
4,75 |
28,5 |
5,34 |
|
1 |
2 |
4 |
6 |
3,25 |
19,5 |
4,42 |
|
1 |
2 |
4 |
11 |
4,5 |
27 |
5, 20 |
|
1 |
2 |
6 |
11 |
5 |
30 |
5,48 |
Вибірка з 1 страти |
Вибірка з 2 страти |
||||||
0 |
4 |
6 |
11 |
3,5 |
21 |
4,58 |
|
1 |
4 |
6 |
11 |
4 |
24 |
4,90 |
|
2 |
4 |
6 |
11 |
4,5 |
27 |
5, 20 |
, .
2. Необхідно провести вибіркове обстеження домогосподарств у місті з метою оцінити середню вартість рухомої власності на одне домогосподарство. Домогосподарства поділені на 2 страти: з високим та низьким рівнем квартирної платні. Вважається, що вартість власності на одне домогосподарство у страті з високим рівнем квартирної платні приблизно у 9 разів більше, ніж у страті з низьким рівнем, і що Sh можуть бути пропорційні квадратному кореню з середнього значення для страти.
Страта з високим рівнем квартирної платні нараховує 4000 домогосподарств, а з низьким - 20000. Як розподілити вибірку обсягом в 1000 між двома стратами?
Розв'язання.
n=1000, N1=4000, N2=20000.
Скористаємось оптимальним розміщенням:
.
,
.
3. У таблиці наведені дані про стратифікацію всіх ферм деякого графства за розміром ферми та про середню кількість акрів на одну ферму в кожній страті.
Для вибірки обсягом в 100 ферм підрахувати обсяги вибірок у кожній страті при
а) пропорційному розміщенні nh,
б) оптимальному розміщенні nh.
Порівняти точність цих методів з точністю при простому випадковому відборі.
Розмір ферми, акрів |
Число ферм, Nh |
Середнє число акрів для ферми, |
Середнє квадратичне відхилення, Sh |
|
0-40 41-80 81-120 121-160 161-200 201-240 більше 241 |
394 461 391 334 169 113 148 |
5,4 16,3 24,3 34,5 42,1 50,1 63,8 |
8,3 13,3 15,1 19,8 24,5 26,0 35,2 |
|
Сумарне або середнє значення |
2010 |
26,3 |
n=100.
a) Пропорційне розміщення:
, , .
n1=20, n2=23, n3=19, n4=17, n5=8, n6=6, n7=7.
б) Оптимальне розміщення:
Wh |
Sh |
Yh |
Wh*Sh |
nh |
Yh*Nh |
Dran/Dprop |
Dran/Dopt |
||
1 |
0, 196 |
8,3 |
5,4 |
1,6268 |
9,6 |
1,0584 |
1,81 |
2,14 |
|
2 |
0,229 |
13,3 |
16,3 |
3,0457 |
17,9 |
3,7327 |
|||
3 |
0, 195 |
15,1 |
24,3 |
2,9445 |
17,3 |
4,7385 |
|||
4 |
0,166 |
19,8 |
34,5 |
3,2868 |
19,3 |
5,727 |
|||
5 |
0,084 |
24,5 |
42,1 |
2,058 |
12,1 |
3,5364 |
|||
6 |
0,056 |
26 |
50,1 |
1,456 |
8,6 |
2,8056 |
|||
7 |
0,074 |
35,2 |
63,8 |
2,6048 |
15,3 |
4,7212 |
|||
УWhSh |
yst |
DYprop |
DYopt |
||||||
17,023 |
26,32 |
655662,5 |
554 555,67 |
Розділ ІІ. Порівняння точності стратифікованого та простого випадкового відбору
2.1 Опис гіпотетичного міста StatVillage
StatVillage - це гіпотетичне місто в Канаді, яке складається з домогосподарств, розташованих у системі блоків на прямокутній ґратці, кожен блок містить 8 домогосподарств. Усередині кожної групи з 8 домогосподарств розташовується номер блоку. Нумерація домогосподарств у блоці відбувається так, як вказано на рисунку 2.1.1
Рис 2.1.1 Нумерація домогосподарств в блоці
Окреме домогосподарство обирають встановивши відмітку на відповідній клітинці. Приклад заповнення блоку вказаний на рисунку 2.1.2
Рис 2.1.2 Приклад заповнення блоку
Існує три різновиди міста StatVillage:
1) найбільше - 128 блоків;
2) середнє - 60 блоків;
3) найменше - 36 блоків.
За вибіркою характеристик домогосподарств міста StatVillage ми можемо оцінити велику кількість змінних, таких як: кількість осіб, кількість жінок та чоловіків, зокрема за різними віковими категоріями, вартість житла, загальний сімейний прибуток тощо.
Дані, наведені для кожної окремої сім'ї є реальними даними анонімних відповідей взятих з перепису населення, проведеного в 1991 році в Канаді. Ці дані були відсортовані за спаданням загального прибутку і розташовані у системі блоків (зліва направо та зверху вниз).
2.2 Постановка задачі
За вибіркою домогосподарств гіпотетичного міста StatVillage оцінити сумарне (середнє) значення загального доходу сімей та кількість жителів домогосподарства, обчислити дисперсії цих оцінок. Використати стратифікований відбір із пропорційним та оптимальним розміщеннями і двома варіантами розбиття на страти:
1. ={блоки 1-32}, ={блоки 33-64}, ={блоки 65-96}, ={блоки 97-128};
2. ={блоки 1-32}, ={блоки 33-80}, ={блоки 81-128}.
Змінною, за якою відбувається стратифікація, обрати загальний прибуток домогосподарств.
Обсяг вибірки дорівнює 96 одиницям.
Порівняти оцінки, знайдені за допомогою простого випадкового відбору і стратифікованого відбору з пропорційним розміщенням та оптимальним розміщенням.
2.3 Розв'язання поставленої задачі
2.3.1 Розрахунок характеристик для популяції
1. Загальний прибуток домогосподарств
N = 1024,
середній прибуток домогосподарств
дисперсія прибутку домогосподарств
.
2. Загальна кількість жителів домогосподарств
N = 1024,середня кількість жителів домогосподарств
дисперсія кількості жителів
.
2.3.2 Визначення обсягів вибірок для кожної страти
Для стратифікованого відбору із пропорційним розміщенням та розбиттям на 4 страти загальне число домогосподарств в кожній страті дорівнює
Тоді число одиниць у вибірці обчислюється як
Отже,
Для стратифікованого відбору із пропорційним розміщенням та розбиттям на 3 страти загальне число домогосподарств в кожній страті дорівнює
Тоді число одиниць у вибірці дорівнює
Для стратифікованого відбору із оптимальним розміщенням та розбиттям на 4 страти число одиниць у вибірці дорівнює
.
Оскільки страти мають однаковий обсяг, то маємо
Для стратифікованого відбору із оптимальним розміщенням та розбиттям на 3 страти число одиниць у вибірці дорівнює
.
Отже, маємо
.
2.3.3 Використання програми Maple 8.0 для відбору одиниць вибірок
with (combinat, randcomb);
1 спосіб поділу на страти: 4 страти
пропорційне розміщення для U1, n1=24
randcomb (256,24);
пропорційне розміщення для U2, n2=24
randcomb (256,24);
пропорційне розміщення для U3, n3=24, randcomb (256,24);
пропорційне розміщення для U4, n4=24
randcomb (256,24);
2 спосіб поділу на страти: 3 страти
пропорційне розміщення для U1, n1=24
randcomb (256,24);
пропорційне розміщення для U2, n2=36
randcomb (384,36);
пропорційне розміщення для U3, n3=36
randcomb (384,36);
1 спосіб поділу на страти: 4 страти
оптимальне розміщення для U1, n1=67
randcomb (256,67);
оптимальне розміщення для U2, n2=3
randcomb (256,3);
оптимальне розміщення для U3, n3=23
randcomb (256,23);
оптимальне розміщення для U4, n4=3
randcomb (256,3);
2 спосіб поділу на страти: 3 страти
оптимальне розміщення для U1, n1=63
randcomb (256,63);
оптимальне розміщення для U2, n2=28 randcomb (384,28);
оптимальне розміщення для U3, n3=5
randcomb (384,5);
простий випадковий відбір
n=96
randcomb (1024,96);
2.3.4 Здобуття вибірок домогосподарств гіпотетичного міста StatVillage
У місті StatVillage обираємо серед домогосподарств ті, номера яких були отримані за допомогою програми Maple 8.0. Отже, маємо:
1) для стратифікованого випадкового відбору з пропорційними розміщенням та розбиттям на 3 страти.
1 страта
2 страта
3 страта
2) для стратифікованого випадкового відбору з пропорційними розміщенням та розбиттям на 4 страти
1 страта
2 страта
3 страта
4 страта
3) для стратифікованого випадкового відбору з оптимальним розміщенням та розбиттям на 3 страти
1 страта
2 страта
3 страта
4) для стратифікованого випадкового відбору з оптимальним розміщенням та розбиттям на 4 страти
1 страта
2 страта
3 страта
4 страта
5) для простого випадкового відбору
Ми здобули вибірки відмічених домогосподарств і одержали вибірки характеристик цих домогосподарств, зокрема, вибірки
загального прибутку сім'ї
Таблиця 2.3.1 Загальний прибуток сімей
Пропорц, 3 страти |
Пропорц, 4 страти |
Оптим, 4 страти |
Оптим, 3 страти |
Пропорц, 3 страти |
Пропорц, 4 страти |
Оптим, 4 страти |
Оптим, 3 страти |
||||
1 |
250000 |
38010 |
224230 |
274200 |
49 |
43000 |
86000 |
82080 |
79400 |
||
2 |
194322 |
38327 |
224308 |
194322 |
50 |
42439 |
86257 |
80800 |
78075 |
||
3 |
162425 |
35800 |
173058 |
173058 |
51 |
52150 |
85320 |
80000 |
76149 |
||
4 |
120000 |
35622 |
162425 |
150750 |
52 |
41868 |
105548 |
80000 |
76000 |
||
5 |
112100 |
49303 |
155215 |
144781 |
53 |
39123 |
83080 |
79350 |
75000 |
||
6 |
105000 |
30000 |
147700 |
142800 |
54 |
40530 |
82986 |
95990 |
99015 |
||
7 |
105664 |
30000 |
144781 |
132998 |
55 |
44484 |
113400 |
76400 |
77300 |
||
8 |
100400 |
35000 |
143140 |
124324 |
56 |
38327 |
79350 |
75853 |
74800 |
||
9 |
104889 |
40434 |
127600 |
126280 |
57 |
49208 |
79532 |
76983 |
73587 |
||
10 |
107589 |
30200 |
129400 |
120000 |
58 |
55929 |
77985 |
74961 |
72400 |
||
11 |
130797 |
25000 |
124324 |
116000 |
59 |
34000 |
77650 |
99015 |
73000 |
||
12 |
96830 |
26925 |
116200 |
116000 |
60 |
40688 |
74800 |
72093 |
72110 |
||
13 |
93933 |
27382 |
116000 |
115936 |
61 |
34494 |
79193 |
72200 |
72200 |
||
14 |
93610 |
42538 |
115400 |
114766 |
62 |
33710 |
72458 |
72800 |
72800 |
||
15 |
88615 |
21248 |
115936 |
110000 |
63 |
30463 |
70800 |
71856 |
71050 |
||
16 |
102614 |
25747 |
112100 |
112144 |
64 |
33200 |
77141 |
71400 |
69731 |
||
17 |
80800 |
38440 |
110300 |
105000 |
65 |
28935 |
65500 |
71000 |
69833 |
||
18 |
113400 |
15000 |
110830 |
114427 |
66 |
57233 |
69600 |
71397 |
72400 |
||
19 |
80050 |
38177 |
108481 |
100702 |
67 |
32425 |
66020 |
70509 |
69200 |
||
20 |
79122 |
12000 |
108601 |
102400 |
68 |
56394 |
63200 |
61400 |
62400 |
||
21 |
76400 |
45720 |
105493 |
99400 |
69 |
44058 |
63200 |
51713 |
68700 |
||
22 |
71238 |
23701 |
105200 |
98957 |
70 |
25000 |
62500 |
49582 |
61151 |
||
23 |
71050 |
19798 |
102865 |
98719 |
71 |
24632 |
65900 |
55683 |
92240 |
||
24 |
70750 |
51087 |
113340 |
107589 |
72 |
25895 |
60800 |
43303 |
61612 |
||
25 |
69833 |
14445 |
124400 |
96050 |
73 |
24000 |
59400 |
41880 |
57527 |
||
26 |
69105 |
9765 |
100400 |
93933 |
74 |
23000 |
57800 |
41800 |
55788 |
||
27 |
79079 |
17180 |
100333 |
93100 |
75 |
34779 |
62763 |
40400 |
53465 |
||
28 |
67681 |
22692 |
99070 |
93082 |
76 |
20370 |
75196 |
52200 |
53475 |
||
29 |
67000 |
30774 |
98100 |
90800 |
77 |
34505 |
56850 |
46831 |
48594 |
||
30 |
66703 |
18073 |
107589 |
90000 |
78 |
18875 |
59391 |
40530 |
50649 |
||
31 |
63652 |
21000 |
96000 |
88846 |
79 |
55619 |
54540 |
39613 |
50367 |
||
32 |
63800 |
19332 |
96193 |
88400 |
80 |
20385 |
53475 |
64489 |
46165 |
||
33 |
61611 |
11971 |
94728 |
88800 |
81 |
19452 |
49400 |
42309 |
45000 |
||
34 |
58224 |
38294 |
94542 |
96348 |
82 |
14402 |
49000 |
42700 |
44409 |
||
35 |
71500 |
16000 |
93728 |
87483 |
83 |
65813 |
48594 |
55929 |
44000 |
||
36 |
57600 |
0 |
107275 |
85500 |
84 |
22692 |
59841 |
34000 |
40250 |
||
37 |
55479 |
1178 |
100850 |
87073 |
85 |
30310 |
46165 |
48325 |
121753 |
||
38 |
69699 |
9692 |
95029 |
85320 |
86 |
28662 |
45000 |
34060 |
40530 |
||
39 |
59148 |
306000 |
92312 |
82720 |
87 |
9406 |
51376 |
32903 |
36690 |
||
40 |
61052 |
224308 |
93100 |
82800 |
88 |
12176 |
42104 |
92162 |
40000 |
||
41 |
56467 |
173777 |
90800 |
82474 |
89 |
21306 |
41880 |
35778 |
37277 |
||
42 |
57219 |
129400 |
90000 |
80800 |
90 |
21348 |
41871 |
56726 |
35800 |
||
43 |
52191 |
120000 |
87483 |
80000 |
91 |
1635 |
52150 |
26925 |
38579 |
||
44 |
53465 |
116000 |
86028 |
80000 |
92 |
20877 |
121753 |
24975 |
26842 |
||
45 |
50527 |
101300 |
85320 |
80000 |
93 |
3975 |
38400 |
29500 |
47720 |
||
46 |
48992 |
98957 |
85691 |
113400 |
94 |
10000 |
68869 |
22261 |
20465 |
||
47 |
46629 |
93610 |
85170 |
79350 |
95 |
9692 |
40012 |
23067 |
5430 |
||
48 |
47562 |
88697 |
102614 |
79000 |
96 |
17049 |
39819 |
17180 |
16000 |
та вибірки кількості жителів домогосподарств
Таблиця 2.3.2 Кількість жителів домогосподарств
Пропорц, 3 страти |
Пропорц, 4 страти |
Оптим, 4 страти |
Оптим, 3 страти |
Пропорц, 3 страти |
Пропорц, 4 страти |
Оптим, 4 страти |
Оптим, 3 страти |
||||
1 |
4 |
5 |
2 |
4 |
49 |
3 |
4 |
4 |
3 |
||
2 |
2 |
6 |
6 |
5 |
50 |
4 |
5 |
4 |
4 |
||
3 |
7 |
8 |
4 |
4 |
51 |
4 |
2 |
1 |
3 |
||
4 |
1 |
4 |
4 |
5 |
52 |
2 |
1 |
1 |
2 |
||
5 |
4 |
1 |
5 |
3 |
53 |
2 |
3 |
3 |
3 |
||
6 |
8 |
2 |
3 |
4 |
54 |
1 |
2 |
3 |
2 |
||
7 |
6 |
6 |
3 |
3 |
55 |
3 |
1 |
4 |
3 |
||
8 |
1 |
2 |
4 |
4 |
56 |
4 |
4 |
3 |
4 |
||
9 |
6 |
5 |
5 |
5 |
57 |
3 |
5 |
5 |
2 |
||
10 |
3 |
2 |
4 |
1 |
58 |
3 |
5 |
4 |
4 |
||
11 |
6 |
2 |
4 |
2 |
59 |
2 |
4 |
2 |
4 |
||
12 |
8 |
3 |
2 |
1 |
60 |
5 |
4 |
2 |
3 |
||
13 |
7 |
2 |
1 |
5 |
61 |
2 |
2 |
3 |
3 |
||
14 |
7 |
8 |
4 |
4 |
62 |
2 |
4 |
4 |
4 |
||
15 |
6 |
2 |
5 |
2 |
63 |
2 |
1 |
3 |
2 |
||
16 |
1 |
5 |
2 |
2 |
64 |
4 |
1 |
3 |
1 |
||
17 |
7 |
4 |
5 |
2 |
65 |
1 |
1 |
4 |
4 |
||
18 |
8 |
3 |
5 |
6 |
66 |
2 |
3 |
4 |
2 |
||
19 |
7 |
5 |
4 |
2 |
67 |
3 |
2 |
6 |
2 |
||
20 |
6 |
4 |
4 |
4 |
68 |
1 |
1 |
3 |
4 |
||
21 |
1 |
3 |
4 |
2 |
69 |
1 |
4 |
2 |
4 |
||
22 |
2 |
4 |
5 |
2 |
70 |
2 |
2 |
4 |
6 |
||
23 |
8 |
2 |
3 |
2 |
71 |
1 |
6 |
2 |
4 |
||
24 |
6 |
4 |
4 |
6 |
72 |
2 |
1 |
2 |
4 |
||
25 |
1 |
5 |
6 |
4 |
73 |
1 |
1 |
2 |
4 |
||
26 |
3 |
5 |
3 |
3 |
74 |
5 |
2 |
2 |
2 |
||
27 |
1 |
4 |
3 |
2 |
75 |
1 |
1 |
3 |
5 |
||
28 |
1 |
4 |
2 |
6 |
76 |
2 |
3 |
2 |
4 |
||
29 |
3 |
4 |
5 |
4 |
77 |
2 |
1 |
5 |
4 |
||
30 |
4 |
5 |
6 |
4 |
78 |
2 |
2 |
3 |
6 |
||
31 |
6 |
3 |
1 |
2 |
79 |
2 |
1 |
5 |
4 |
||
32 |
4 |
2 |
4 |
3 |
80 |
2 |
2 |
4 |
3 |
||
33 |
6 |
4 |
3 |
5 |
81 |
5 |
3 |
3 |
5 |
||
34 |
5 |
4 |
2 |
3 |
82 |
6 |
2 |
2 |
6 |
||
35 |
2 |
3 |
3 |
6 |
83 |
1 |
1 |
2 |
2 |
||
36 |
8 |
4 |
4 |
2 |
84 |
2 |
2 |
1 |
1 |
||
37 |
2 |
5 |
4 |
3 |
85 |
2 |
2 |
1 |
3 |
||
38 |
8 |
5 |
8 |
2 |
86 |
2 |
4 |
3 |
2 |
||
39 |
6 |
2 |
2 |
2 |
87 |
2 |
1 |
4 |
2 |
||
40 |
8 |
2 |
2 |
4 |
88 |
2 |
1 |
2 |
2 |
||
41 |
3 |
2 |
4 |
5 |
89 |
1 |
2 |
3 |
3 |
||
42 |
8 |
4 |
4 |
4 |
90 |
1 |
1 |
5 |
1 |
||
43 |
2 |
3 |
6 |
1 |
91 |
2 |
2 |
4 |
1 |
||
44 |
8 |
4 |
3 |
1 |
92 |
5 |
1 |
2 |
4 |
||
45 |
5 |
3 |
2 |
2 |
93 |
2 |
4 |
2 |
2 |
||
46 |
4 |
3 |
6 |
4 |
94 |
3 |
3 |
4 |
2 |
||
47 |
5 |
2 |
6 |
3 |
95 |
4 |
1 |
2 |
4 |
||
48 |
2 |
1 |
2 |
2 |
96 |
3 |
4 |
2 |
1 |
2.3.5 Дисперсії оцінок
І. Знайдемо оцінку загального прибутку домогосподарств при простому випадковому відборі
Дисперсія оцінки дорівнює
,
Знайдемо оцінку загального прибутку домогосподарств при стратифікованому відборі із пропорційним розміщенням nh та розбиттям на 3 страти n1 = 24 - 9,375% із 256 одиниць в страті 1,n2 =36 - 9,375% із 384 одиниць в страті 2,n3 = 36 - 9,375% із 384 одиниць в страті 3.
,
,
При розбитті на 4 страти
n1 = 24 - 9,375% із 256 одиниць в страті 1,n2 =24 - 9,375% із 256 одиниць в страті 2,n3 = 24 - 9,375% із 256 одиниць в страті 3,n4 =24 - 9,375% із 256 одиниць в страті 4,
,
Знайдемо оцінку загального прибутку домогосподарств при стратифікованому відборі із оптимальним розміщенням nh та розбиттям на 3 страти n1 = 63 - 24,61% із 256 одиниць в страті 1,n2 =28 - 7,29% із 384 одиниць в страті 2,n3 = 5 - 1,3% із 384 одиниць в страті 3,
,
При розбитті на 4 страти n1 = 67 - 26,17% із 256 одиниць в страті 1,n2 =3 - 1,17% із 256 одиниць в страті 2,n3 = 23 - 8,98% із 256 одиниць в страті 3,n4 =3 - 1,17% із 256 одиниць в страті 4,
,
2.4 Порівняння стратифікованого випадкового відбору з простим випадковим відбором
Дисперсія оцінки загального прибутку при простому випадковому відборі:
.
Дисперсія оцінки загального прибутку при стратифікованому випадковому відборі з пропорційним розміщенням і розбиттям на 3 страти:
.
Дисперсія оцінки загального прибутку при стратифікованому випадковому відборі з пропорційним розміщенням і розбиттям на 4 страти:
Подобные документы
Оцінювання середнього та сумарного значення популяції. Порівняння систематичного відбору зі стратифікованим випадковим відбором. Популяції з "випадковим" порядком розміщення одиниць. Автокорельовані популяції. Оцінювання дисперсії за окремою вибіркою.
дипломная работа [858,2 K], добавлен 12.08.2010Визначення і характеристики випадкового процесу. Марковські ймовірнісні процеси з дискретними станами. Стаціонарна нерегулярна діяльність і ергодична властивість по математичному очікуванню стаціонарного мимовільного процесу і його кореляційна функція.
курсовая работа [26,9 K], добавлен 17.01.2011Обчислення оцінок основних статистичних характеристик: середнього значення, середнього квадратичного відхилення результатів, дисперсії розсіювання результатів вимірювань, коефіцієнта асиметрії. Перевірка наявніості похибок за коефіцієнтом Стьюдента.
контрольная работа [245,5 K], добавлен 25.02.2011Методи перевірки чисел на простоту: критерій Люка та його теореми, їх доведення. Теорема Поклінгтона та її леми. Метод Маурера - швидкий алгоритм генерації доведених простих чисел, близьких до випадкового та доведення Д. Коувером і Дж. Куіскуотером.
лекция [138,8 K], добавлен 08.02.2011Отримання аналогів теореми порівняння Колмогорова для класу функцій, що задаються обмеженнями на несиметричні норми старших похідних. Випадок класів, які задаються обмеженнями на декілька похідних. Означення екстремальної функції, її властивості.
дипломная работа [1,4 M], добавлен 11.06.2017Рішення з заданим ступенем точності задачі Коші для системи диференціальних рівнянь на заданому інтервалі. Формування мінімальної погрішності на другому кінці. Графіки отриманих рішень і порівняння їх з точним рішенням. Опис математичних методів рішення.
курсовая работа [258,9 K], добавлен 27.12.2010Особливості реалізації алгоритмів Прима та Крускала побудови остового дерева у графі. Оцінка швидкодії реалізованого варіанта алгоритму. Характеристика різних методів побудови остовних дерев мінімальної вартості. Порівняння використовуваних алгоритмів.
курсовая работа [177,3 K], добавлен 18.08.2010Побудова графіків реалізацій вхідного та вихідного процесів, розрахунок функцій розподілу, математичного сподівання, кореляційної функції. Поняття та принципи вивчення одномірної функції розподілу відгуку, порядок конструювання математичної моделі.
контрольная работа [316,2 K], добавлен 08.11.2014Розподіли системи двох випадкових величин, що однозначно визначається сумісним розподілом ймовірностей, який можна задати матрицею. Інтегральна функція розподілу випадкового вектора. Середньоквадратична регресія. Лінійна кореляція нормальних величин.
реферат [253,5 K], добавлен 13.06.2010Обчислення меж гіперболічних функцій та замінна змінного. Порівняння гіперболічних і зворотних до них функцій. Диференціювання зворотних гіперболічних функцій, невизначений інтеграл. Розкладання гіперболічних функцій по формулах Тейлора та Маклорена.
курсовая работа [2,0 M], добавлен 11.02.2011