Стратифікований випадковий відбір
Дослідження стратифікованого випадкового відбору та його порівняння з простим випадковим відбором. Оцінювання дисперсії та довірчі межі для середнього та сумарного значення популяції. Порівняння точності стратифікованого та простого випадкового відбору.
Рубрика | Математика |
Вид | дипломная работа |
Язык | украинский |
Дата добавления | 12.08.2010 |
Размер файла | 3,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
.
Дисперсія оцінки загального прибутку при стратифікованому випадковому відборі з оптимальним розміщенням і розбиттям на 3 страти:
.
Дисперсія оцінки загального прибутку при стратифікованому випадковому відборі з оптимальним розміщенням і розбиттям на 4 страти:
.
Відносна точність стратифікованого випадкового відбору в порівнянні з простим випадковим відбором:
Отже, стратифікований випадковий відбір із оптимальним розміщенням дає виграш у точності.
Дисперсія оцінки кількості жителів домогосподарства при простому випадковому відборі:
Дисперсія оцінки кількості жителів домогосподарства при стратифікованому випадковому відборі з пропорційним розміщенням і розбиттям на 3 страти . Дисперсія оцінки кількості жителів домогосподарства при стратифікованому випадковому відборі з пропорційним розміщенням і розбиттям на 4 страти . Дисперсія оцінки кількості жителів домогосподарства при стратифікованому випадковому відборі з оптимальним розміщенням і розбиттям на 3 страти
.
Дисперсія оцінки кількості жителів домогосподарства при стратифікованому випадковому відборі з оптимальним розміщенням і розбиттям на 4 страти
.
Порівняємо їх точність:
Отже, стратифікований випадковий відбір із оптимальним розміщенням дає виграш у точності. Це демонструє виконання нерівностей (1.4 1):
Висновки
Метод вибіркових досліджень - це спосіб відбору певної кількості одиниць популяції, за результатами вивчення яких дослідник робить висновки стосовно характеристик цієї популяції.
При стратифікованому випадковому відборі популяція, що містить N одиниць, спочатку поділяється на субпопуляції (підпопуляції), що складаються відповідно з N1, N2,..., NL одиниць. Ці підпопуляції не містять спільних одиниць і разом вичерпують усю популяцію, так що справедлива рівність (1):
N1 + N2 +... + NL = N.
Такі підпопуляції називають стратами. Для того, щоб можна було повністю скористатися вигодами від стратифікації, значення N1, N2,…, NL повинні бути відомі. За визначених страт, у кожній страті вибірка добувається за допомогою простого випадкового відбору. Обсяги вибірок всередині страт позначаються відповідно через n1,n2,..., nL.
У роботі ставиться задача порівняння точності стратифікованого випадкового відбору та простого випадкового відбору на прикладі вибіркового обстеження домогосподарств віртуального міста StatVillage. Для розв'язання поставленої задачі використано наступні теоретичні положення.
Теорема 1: Оскільки при простому випадковому відборі вибіркові середні всередині страт є незміщеними оцінками середнього страт, то при стратифікованому випадковому відборі середнє значення стратифікованої вибірки є незміщеною оцінкою середнього значення популяції.
Теорема 2: Дисперсія середнього значення стратифікованої вибірки знаходиться формулою (4), де fh - частки відбору в кожній страті.
Наслідок: Якщо частки відбору в усіх стратах малі, то дисперсію середнього значення стратифікованої вибірки обчислюють за формулою (5).
Означення: Стратифікацією з пропорційним розміщенням nh називається стратифікація при якій частка відбору однакова для всіх страт, де nh - обсяг вибірки, який добувається зі страти h обчислюється за формулою (6).
Для вибірки з пропорційним розміщенням nh дисперсія середнього значення стратифікованої вибірки визначається рівністю (7), а за умов однакової дисперсії всередині страт - за формулою (8).
Теорема 3: Дисперсія оцінки сумарного значення популяції визначається формулою (9).
Теорема 4: Незміщеною оцінкою дисперсії виступає оцінка вигляду (10), а за умов однакової оцінки дисперсії всередині страт - оцінка (11).
Означення: Стратифікацією з оптимальним розміщенням називають стратифікацію, за якої дисперсія середнього значення стратифікованої вибірки мінімальна.
Теорема 5: Якщо виконується співвідношення (13), то дисперсія середнього значення стратифікованої вибірки мінімальна.
Теорема 6: Якщо загальний обсяг вибірки незмінний і виконується рівність (14), то дисперсія середнього значення стратифікованої вибірки мінімальна.
Теорема 7: Якщо знехтувати величинами порядку nh/N, то для дисперсії середнього значення стратифікованої вибірки при стратифікації з пропорційним розміщенням справедливі нерівності (15).
У роботі була поставлена наступна задача:
За вибіркою домогосподарств міста StatVillage оцінити сумарне значення загального доходу сімей та кількість жителів. Використати стратифікований відбір із пропорційним та оптимальним розміщеннями і двома варіантами розбиття на страти:
1. ={блоки 1-32}, ={блоки 33-64}, ={блоки 65-96}, ={блоки 97-128};
2. ={блоки 1-32}, ={блоки 33-80}, ={блоки 81-128}.
Змінна, за якою відбувається стратифікація - загальний прибуток домогосподарств. n=96.
Необхідно порівняти точності оцінок, знайдених за допомогою простого випадкового відбору і стратифікованого відбору з пропорційним розміщенням nh та оптимальним розміщенням nh.
При розв'язанні поставленої задачі ми користувались вищенаведеною теорією та програмами StatVillage і Maple.
Використовуючи програмне середовище Maple за допомогою генератора випадкових чисел ми отримували номери необхідних одиниць домогосподарств з кожної страти для обох варіантів розбиття. Потім у середовищі StatVillage ставили позначку в клітинах з отриманими номерами. Після натиснення кнопки "Get the Sample Units" з'являлись стовпці з даними які ми використовували для подальших обчислень.
При розбитті на 4 страти обсяги вибірок ми обчислювали за формулою (16) при стратифікації з оптимальним розміщенням nh і (17) при стратифікації із пропорційним розміщенням nh. Обсяги відбору в стратах дорівнювали: 24 у кожній страті при пропорційному розміщенні nh і n1=67, n2=3, n3=23, n4=3 при оптимальному розміщенні nh. В останньому випадку обсяги відбору у стратах суттєво різняться, так як формула (16) враховує величину дисперсії всередині страти. При стратифікації з пропорційним розміщенням обсяги відбору залежить тільки від обсягу страти та загальної частки відбору, тому при однаковому обсязі страт обсяг відбору однаковий для кожної страти.
Ми отримали наступні результати: при оцінюванні сумарного значення загального прибутку та кількості жителів найбільш точним виявився стратифікований відбір із оптимальним розміщенням, другим за точністю є стратифікований відбір із пропорційним розміщенням, найменш точним є простий випадковий відбір. Аналогічний результат отримуємо при розбитті на 3 страти.
Таким чином ми підтвердили результат теореми 7 (15).
Стратифікований випадковий відбір має свої переваги та недоліки. До переваг можна віднести те, що стратифікований випадковий відбір завжди забезпечує високу точність за умови однорідності одиниць всередині страт, причому чим більшими є відмінності між стратами, тим більшою буде точність. Крім того, він дає більш повну інформацію про популяцію, ніж простий випадковий відбір.
Проте, стратифікований випадковий відбір має деякі недоліки, наприклад, для його застосування необхідно мати додаткову інформацію про структуру популяції для оптимального розбиття на страти.
Список використаних джерел
1. ?. ?????? ?????? ??????????? ????????????. - ?.: ??????????, 1975. - 435?.
2. ?????? ?.?. ??????? ?????????? ??????????. - ?.: ?????, 2001. - 247?.
3. govindarajulu Z. Elements of Sampling Theory and Methods. - 411?.
4. J. N. K. Rao. Small Area Estimation. - Wiley Interscience - 313c.
5. Sharon L. Lohr Sampling: Design and Analysis - Duxbury Press, 1999. - 253c.
6 .?. ??.?. ?????, ?.?. ????? ?????????????? ?????? ?????? ? ??????????- ?.: ??????? ? ??????????, 1991. - 161?.
Додатки
Додаток А
Стратифікований випадковий відбір
Теорема 1. . (3)
Теорема 2. . (4)
Наслідок. (5)
Означення. Стратифікація з пропорційним розміщенням nh:
(6)
Наслідок. (7)
Наслідок (8)
Теорема 3. . (9)
Теорема 4. : . (10)
Наслідок. (11)
Означення. Стратифікація з оптимальним розміщенням nh:
(12)
Теорема 5. (13)
Теорема 6. (14)
Теорема 7. (15)
Постановка задачі
За вибіркою домогосподарств міста StatVillage оцінити сумарне значення загального доходу сімей та кількість жителів, обчислити дисперсії цих оцінок. Використати стратифікований відбір із пропорційним та оптимальним розміщеннями:
1. ={блоки 1-32}, ={блоки 33-64}, ={блоки 65-96}, ={блоки 97-128};
2. ={блоки 1-32}, ={блоки 33-80}, ={блоки 81-128}.
Змінна, за якою відбувається стратифікація - загальний прибуток домогосподарств.
Обсяг вибірки n=96.
Необхідно порівняти точності оцінок, знайдені за допомогою простого випадкового відбору і стратифікованого відбору з пропорційним розміщенням та оптимальним розміщенням.
Пропорційне розміщення, розбиття на 4 страти
Оптимальне розміщення, розбиття на 4 страти
Загальний прибуток
3 страти |
4 страти |
Кількість жителів домогосподарства
3 страти |
4 страти |
Подобные документы
Оцінювання середнього та сумарного значення популяції. Порівняння систематичного відбору зі стратифікованим випадковим відбором. Популяції з "випадковим" порядком розміщення одиниць. Автокорельовані популяції. Оцінювання дисперсії за окремою вибіркою.
дипломная работа [858,2 K], добавлен 12.08.2010Визначення і характеристики випадкового процесу. Марковські ймовірнісні процеси з дискретними станами. Стаціонарна нерегулярна діяльність і ергодична властивість по математичному очікуванню стаціонарного мимовільного процесу і його кореляційна функція.
курсовая работа [26,9 K], добавлен 17.01.2011Обчислення оцінок основних статистичних характеристик: середнього значення, середнього квадратичного відхилення результатів, дисперсії розсіювання результатів вимірювань, коефіцієнта асиметрії. Перевірка наявніості похибок за коефіцієнтом Стьюдента.
контрольная работа [245,5 K], добавлен 25.02.2011Методи перевірки чисел на простоту: критерій Люка та його теореми, їх доведення. Теорема Поклінгтона та її леми. Метод Маурера - швидкий алгоритм генерації доведених простих чисел, близьких до випадкового та доведення Д. Коувером і Дж. Куіскуотером.
лекция [138,8 K], добавлен 08.02.2011Отримання аналогів теореми порівняння Колмогорова для класу функцій, що задаються обмеженнями на несиметричні норми старших похідних. Випадок класів, які задаються обмеженнями на декілька похідних. Означення екстремальної функції, її властивості.
дипломная работа [1,4 M], добавлен 11.06.2017Рішення з заданим ступенем точності задачі Коші для системи диференціальних рівнянь на заданому інтервалі. Формування мінімальної погрішності на другому кінці. Графіки отриманих рішень і порівняння їх з точним рішенням. Опис математичних методів рішення.
курсовая работа [258,9 K], добавлен 27.12.2010Особливості реалізації алгоритмів Прима та Крускала побудови остового дерева у графі. Оцінка швидкодії реалізованого варіанта алгоритму. Характеристика різних методів побудови остовних дерев мінімальної вартості. Порівняння використовуваних алгоритмів.
курсовая работа [177,3 K], добавлен 18.08.2010Побудова графіків реалізацій вхідного та вихідного процесів, розрахунок функцій розподілу, математичного сподівання, кореляційної функції. Поняття та принципи вивчення одномірної функції розподілу відгуку, порядок конструювання математичної моделі.
контрольная работа [316,2 K], добавлен 08.11.2014Розподіли системи двох випадкових величин, що однозначно визначається сумісним розподілом ймовірностей, який можна задати матрицею. Інтегральна функція розподілу випадкового вектора. Середньоквадратична регресія. Лінійна кореляція нормальних величин.
реферат [253,5 K], добавлен 13.06.2010Обчислення меж гіперболічних функцій та замінна змінного. Порівняння гіперболічних і зворотних до них функцій. Диференціювання зворотних гіперболічних функцій, невизначений інтеграл. Розкладання гіперболічних функцій по формулах Тейлора та Маклорена.
курсовая работа [2,0 M], добавлен 11.02.2011