Загальні поняття математичної статистики. Оцінка розподілу випадкової величини
Задачі і методи математичної статистики – науки, предметом якої є випадкові масові спостереження, які можна характеризувати у шкалах чи в інтервалах відносин і значеннях дискретних чи неперервних випадкових величин. Вибіркові характеристики розподілів.
Рубрика | Математика |
Вид | реферат |
Язык | украинский |
Дата добавления | 10.02.2011 |
Размер файла | 153,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ЗАГАЛЬНІ ПОНЯТТЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ. ОЦІНКА РОЗПОДІЛУ ВИПАДКОВОЇ ВЕЛИЧИНИ
1. Задачі і методи математичної статистики
математична статистика дискретний
Математична статистика - це наука, предметом якої є випадкові масові спостереження, які можна характеризувати у шкалах чи в інтервалах відносин і значеннях дискретних чи неперервних випадкових величин, множина яких може бути скінченою чи нескінченною, зліченою чи континуальною. Математичну статистику можна розглядати також як специфічний розділ теорії ймовірностей, що займається розв'язанням її зворотних задач.
Дійсно, якщо задачі теорії ймовірностей є задачами синтезу і полягають в визначенні ймовірностей складних подій за відомими ймовірностями складових елементарних подій і відомих законів розподілу відповідних випадкових величин, то задачі математичної статистики є задачами аналізу. Вони полягають в розробці методів відбору й угруповання статистичних даних, а також їхньої обробки з метою визначення ймовірностей елементарних подій, виявлення характеру відповідних випадкових величин: оцінки законів їхнього розподілу, з'ясування їхніх числових характеристик, зв'язків між випадковими величинами і для прийняття статистичних рішень за результатами статистичного аналізу.
Математичну статистику можна визначити ще як науку про прийняття рішень в умовах невизначеності.
У процесі статистичних досліджень ставляться і розв'язуються такі основні задачі, які складають предмет відповідних розділів математичної статистики:
1) побудова емпіричного закону розподілу випадкової величини за експериментальними даними;
2) перевірка істинності вигляду отриманого емпіричного закону розподілу випадкової величини;
3) оцінка невідомих параметрів отриманого закону розподілу за значеннями експериментальних даних;
4) статистична перевірка гіпотез, які відносяться до розглянутих розподілів даних випробувань чи спостережень масових явищ.
До статистичних досліджень у математичній статистиці ставляться такі вимоги:
1) витрати на проведення дослідження мають бути відповідними цінності інформації, які очікують одержати;
2) збір інформації, обробка результатів спостережень і статистичних висновків має здійснюватися за час, поки ця інформація не застаріє;
3) результати спостережень мають бути достовірні: вони мають об'єктивно відображати важливі властивості об'єктів.
При цьому розрізняють такі методи і способи обстеження об'єктів, що досліджуються:
- обстеження без винятку усіх елементів сукупності, що звичайно є неможливим з принципових або з економічних причин;
- обстеження заздалегідь визначеної частини елементів усієї сукупності об'єктів, відібраної з деяких суб'єктивних міркувань;
- обстеження деякої частини елементів усієї сукупності об'єктів, що вибрано з неї за визначеними об'єктивними правилами, розробленими у вибірковому методі.
В математичній статистиці уся множина об'єктів сукупності, що обстежується, називається генеральною сукупністю, а її частина, обрана для дослідження - вибірковою сукупністю чи просто вибіркою.
Основним способом вивчення властивостей об'єктів генеральної сукупності в математичній статистиці є вибірковий метод. Він полягає в дослідженні вибірки з генеральної сукупності й у побудові на його основі висновків і підсумків про всю сукупність. Для цього необхідно, щоб вибірка задовольняла визначеним вимогам, що складають суть вибіркового методу.
2. Вибірковий метод
Під вибірковим методом розуміють перелік правил і прийомів для виділення з генеральної сукупності об'єктів її частини для дослідження, для знаходження значень характеристик вибірки, а також для одержання статистичних висновків про генеральну сукупність об'єктів, з якої цю вибірку взято. Основою вибіркового методу є випадкова вибірка.
Вибірка називається випадковою, якщо до здійснення добору кожен елемент сукупності володіє, заздалегідь визначеною ймовірністю бути включеним у вибірку. Зокрема, якщо ці ймовірності для всіх елементів однакові, вибірка називається простою випадковою вибіркою.
Розрізняють два способи організації випадкової вибірки:
- вибірка з поверненням (незалежні випробування);
- вибірка без повернення (залежні випробування).
Їхню сутність і розходження між ними пояснює наступний класичний приклад: нехай в урні є однакових за формою і масою куль, причому з цих куль - білі. З цієї сукупності, яку можна назвати генеральною сукупністю обсягу , довільним образом беруть вибірку обсягу .
Під час вибірки з поверненням щораз після витягнення кулі та визначення її кольору її повертають назад і перемішують усі кулі. Очевидно, що при цьому ймовірність для білої кулі попасти у вибірку залишається щораз постійною та дорівнює , а випадкова величина , яку визначено як таку, що прийняті нею значення дорівнюють числу білих куль, які потрапили у вибірку обсягу , розподілена за біноміальним законом Бернуллі:
, (1)
де - кількість сполучень з елементів по .
Під час вибірки без повернення після визначення кольору кожної витягнутої з урни кулі її не кладуть назад. При цьому умови витягнення кулі щораз змінюються і, як знайдено під час вирішення відомої задачі теорії ймовірностей, відповідна випадкова величина підкоряється вже зовсім іншому закону розподілу - гіпергеометричному:
. (2)
Як можна переконатися під час проведення обчислень за формулами (1) і (2), ймовірності і розрізняються тим більше, чим менше обсяг генеральної сукупності . Зі зростанням це розходження зменшується; при воно вже несуттєво, а при формули (1) і (2) дають однакові результати.
Таким чином, при малому значенні вибірка без повернення дає практично такий же результат (формули (1) і (2)), що і вибірка з поверненням. Однак можна показати, що дисперсія введеної вище випадкової величини під час одержання безповоротної вибірки значно нижче, ніж у випадку вибірки з поверненням. Це означає, що безповоротна вибірка дає більш ефективну оцінку досліджуваного параметра генеральної сукупності. Крім того, її легше провести практично. Тому в статистичних дослідженнях звичайно застосовують вибірку без повернення витягнутого об'єкта до генеральної сукупності.
3. Способи організації вибірки
Для об'єктивності статистичних висновків щодо елементів генеральної сукупності, отриманих на основі дослідження вибірки, необхідно щоб вона була репрезентативною (представницькою), тобто щоб вона відображала всі характерні риси генеральної сукупності. Інакше вибіркове дослідження призведе до хибних, зміщених результатів. Для запобігання цьому розроблено процедуру випадкового (ймовірнісного) добору об'єктів з генеральної сукупності. Вона не гарантує від помилок під час формування вибірки, однак, дозволяє теоретично оцінити їхню ймовірність.
Основні властивості вибірки, які отримано таким випадковим добором, є такі:
- ймовірність того, що вона не є презентативною, відносно мала;
- ця ймовірність зменшується у разі збільшення обсягу вибірки;
- ця ймовірність може бути визначена.
У математичній статистиці розроблено кілька способів організації вибірки, основними з яких є наступні:
- випадкова вибірка;
- систематична вибірка;
- районована вибірка;
- ступенева вибірка.
Під час цього для них усіх основою є деяка генеральна вибірка, у якій усі об'єкти зареєстровані відповідно до тої чи іншої форми.
Випадкова (ймовірнісна) вибірка характеризується виконанням наступних вимог:
- усі елементи генеральної сукупності, які розглядаються, можна ототожнити з перенумерованими, однаковими за формою та за масою кулями, які покладено в урну і ретельно перемішано;
- з урни навмання вибирається необхідна кількість куль, що дорівнює обсягу вибірки, та фіксуються написані на них номери;
- ці номери вказують елементи генеральної сукупності, з яких буде утворено вибірку.
Однак практично реалізувати такий принципово можливий спосіб організації випадкової вибірки дуже важко. Тому випадкові вибірки в математичній статистиці здійснюють за допомогою комп'ютерної програми генератора випадкових чисел, або спеціально підготовленої таблиці випадкових чисел.
Систематичною вибіркою називається вибірка, організована за деяким правилом, наприклад, витягнення з генеральної сукупності елементів, у яких номера є однаковими між собою за обраним модулем, тобто через рівні проміжки. Таку систематичну вибірку можна вважати випадковою, за винятком малоймовірного випадку, коли досліджувана ознака в упорядкованому наборі об'єктів генеральної сукупності також має циклічний характер з періодом, що є наближеним до модуля правила добору.
Районованою вибіркою називається модифікація випадкової вибірки, при "порайонній" організації витягнення елементів з генеральної сукупності у вибірку. Її доцільно проводити у випадку, якщо "райони" відрізняються один від одного середніми значеннями досліджуваної ознаки, але мають однакові дисперсії. Отримані в такий спосіб "по районах" середні значення, усереднені потім по усій вибірці, будуть мати меншу дисперсію, тобто кращу точність, чим для середнього значення, отриманого відразу по всій вибірці. Слід зазначити, що цей спосіб організації вибірки було узагальнено на випадок, коли "райони" розрізняються не тільки середніми, але і дисперсіями.
Ступенева вибірка подібна до районованої вибірки розбивкою генеральної сукупності на групи. Однак принцип її розбивки тепер визначається винятково зручністю роботи та зниженням вартості обстеження, причому не підвищується також точність оцінки.
4. Непараметричне оцінювання розподілу випадкової величини
Універсальним засобом опису випадкової величини є її функція розподілу , що визначається як імовірність того, що випадкова величина прийме значення менше, ніж : . Її доповнюють, так званим, законом розподілу, що для неперервної випадкової величини є похідною функції , а у випадку дискретної випадкової величини має вигляд варіаційного ряду.
Однією з основних задач математичної статистики є оцінка закону розподілу випадкової величини, що досліджується, за результатами вибіркового обстеження. Для цього застосовують два способи оцінки закону розподілу: непараметричний і параметричний.
Непараметричний спосіб полягає в побудові статистичних аналогів теоретичних законів розподілу з наступним отриманням характеристик положення та розсіювання випадкової величини. Подальша, більш глибока, оцінка закону розподілу випадкової величини, що досліджується, проводиться параметричним способом. Для цього необхідно вже мати обґрунтоване припущення про відомий вигляд закону розподілу випадкової величини з точністю до параметру скінченої розмірності, значення якого будуть оцінюватися за результатами статистичного аналізу вибірки.
Статистичний розподіл вибірки. Розглянемо випадкову вибірку обсягу з генеральної сукупності. Припустимо, що в цій вибірці значення , що приймається випадковою величиною , зустрічається разів, значення - разів, ... , - разів, причому .
Значення , що приймаються випадковою величиною , називаються при цьому варіантами, послідовність варіант, записаних у порядку зростання, - варіаційним рядом, а числа (кількість повторень значення у вибірці) - частотами, відповідно їхнє відношення до обсягу вибірки - відносними частотами: .
Статистичним розподілом вибірки називають перелік варіантів і відповідних їм частот або відносних частот. У разі неперервної випадкової величини розподіл вибірки задають у вигляді послідовності інтервалів і відповідних їм частот, точніше суми частот, що потрапили у цей інтервал.
Емпірична функція розподілу кількісної ознаки в математичній статистиці вводиться за аналогією з функцією розподілу ймовірностей у теорії ймовірностей. Для цього позначають через кількість випадків, при яких спостерігалося значення ознаки , що є меншим ніж . Під час цього відносна частота події дорівнює . Очевидно, що вона змінюється разом з , тобто вона є функцією аргументу .
Емпіричною функцією розподілу (функцією розподілу вибірки) називають функцію , значення якої дорівнюють відносній частоті події . Тобто:
.
Приклад Знайти емпіричну функцію розподілу ймовірностей випадкової величини за даних розподілів вибірки (табл. 1):
Таблиця 1
1 |
4 |
6 |
||
10 |
15 |
25 |
Розв'язання. Обсяг вибірки n=10+15+25=50.
Найменша варіанта , отже
Графік цієї функції зображено на рис.
Рисунок 1 - Емпірична функція розподілу
На відміну від емпіричної функції розподілу вибірки функцію розподілу генеральної сукупності називають теоретичною функцією розподілу.
З теореми Бернуллі випливає, що відносна частота події , тобто наближається за ймовірністю до ймовірності цієї подій. Тобто, при великих значення і мало відрізняються одне від одного, тому що
,
де є як завгодно мале позитивне число.
З уведеного визначення емпіричної функції розподілу випливають її властивості, ті ж самі, що у її аналога - функції :
1) значення функції належать до відрізку ;
2) - є неубутною функцією;
3) якщо - найменша, а - найбільша варіанти, то при , і при ;
Таким чином, емпірична функція розподілу кількісної ознаки у вибірці є оцінкою теоретичної функції розподілу випадкової величини у генеральній сукупності.
Полігон і гістограма. Наочне уявлення про характер варіаційного ряду дає його графічне зображення, зокрема, у вигляді полігона частот для дискретної випадкової величини і гістограми у разі неперервної величини.
Полігоном частот називається ламана, що з'єднує точки , ,..., на площині, де введено декартову систему координат (по горизонталі відкладають значення варіант , а по вертикалі - відповідні їм частоти ).
Аналогічно вводять полігон відносних частот, змінюючи частоти на відносні частоти .
Інтервальний варіаційний ряд графічно зручно зображується у вигляді гістограми частот, для чого інтервал, до якого укладаються всі значення ознаки, що досліджується, розбивають на кілька часткових інтервалів довжиною і знаходять для кожного часткового інтервалу суму частот варіант, що потрапили до -го інтервалу.
Гістограма частот являє собою ряд зімкнутих прямокутників, підставою кожного з яких служить інтервал довжиною , а висота дорівнює відношенню . Площа -го прямокутника дорівнює . Тому площа всієї гістограми дорівнює - обсягу вибірки.
Гістограмою відносних частот називається щаблева фігура, що складається з прямокутників, підставами яких служать часткові інтервали довжиною , а висоти дорівнюють відношенню .
Приклад. У таблиці 2 наведено згруповані дані з запасів взуття в 100 магазинах (за вартістю).
Таблиця 2
Інтервал тис. гр. |
0,2-2,2 |
2,2-4,2 |
4,2-6,2 |
6,2-8,2 |
8,2-10,2 |
10,2-12,2 |
|
Чисельність магазинів в інтервалі ni |
70 |
20 |
4 |
3 |
2 |
1 |
Знайти емпіричну щільність розподілу вартості взуття методом гістограми і полігона відносних частот.
Розв'язання. Гістограму і полігон відносних частот подано на рис. 2:
Рисунок 2 - Гістограма розподілу
На цьому рисунку по горизонталі відкладені інтервали довжиною значень вартості, що спостерігаються, а із середин інтервалів вертикально відкладені щільності відносних частот . Суцільна лінія - гістограма, пунктирна - полігон відносних частот.
5. Вибіркові характеристики розподілів. Обґрунтовані та незміщені оцінки
У математичній статистиці, як і в теорії ймовірностей можна обчислити всі характеристики положення центра групування і характеристики варіації (розсіювання).
Нехай досліджувана ознака, а його оцінка, отримана вибірковим методом ( обсяг вибірки). Точність оцінки буде характеризувати величина ( математичне чекання), у якій виділимо систематичну і випадкову помилки.
.
Перший додаток в останньому виразі характеризує випадкову помилку, другий - систематичну. Для усунення систематичної помилки вважатимемо, щоб .
Умова
забезпечить зменшення випадкової помилки при збільшенні обсягу n вибірки. У статистиці рівність
називають умовою незміщеності оцінки, а границю
- умовою обґрунтованості оцінки.
До статистичних властивостей оцінок відносять також властивість ефективності оцінки, що полягає в тому, що ефективна оцінка має мінімальну дисперсію у визначеному класі оцінок.
Застосуємо вибірковий метод для одержання оцінок математичного сподівання і дисперсії випадкової величини .
Нехай , ,..., - випадкова вибірка. Як вибіркову оцінку розглянемо величину
. (3)
Значення , ,..., , які приймає одна випадкова величина , можна розглядати також як значення, що приймають ідентичних випадкових величин ( ) з математичним сподіванням . При цьому середнє значення (3) є вже випадковою величиною, що є середнім випадкових величин ( ):
. (4)
Перевіримо і впевнимося, що ця оцінка задовольняє вимогам незміщеності і обґрунтованості:
;
.
Зручно ввести оператор усереднення . При цьому
.
Таким чином, оцінка математичного сподівання (3) є незміщеною. Її традиційно позначають як і називають емпіричним (вибірковим) середнім:
. (5)
Для одержання вибіркової оцінки замінимо оператор математичного сподівання оператором усереднення. Тоді
, (6)
Де .
Застосуємо до оцінки операцію математичного сподівання, використовуючи в (6) тотожне перетворення
.
Звідси очевидно, що вибіркова оцінка (6) має математичне сподівання, яке не дорівнює дисперсії при задовільному : воно виявилося меншим дисперсії на . Тобто оцінка не задовольняє умові незміщенності. При великих значеннях ця відмінність несуттєва, а при скінчених зміщеність в оцінці (6) можна усунути перетворенням - шляхом помноження її на поправочний коефіцієнт :
.
При цьому, по суті, вводиться нова вибіркова оцінка дисперсії, що називається емпіричною (вибірковою) дисперсією, яка традиційно позначається як і вже є незміщеною:
. (7)
Аналогічно знайдемо вибіркову оцінку коваріації випадкових величин і . Нехай і - вибірки з випадкових величин і , тоді
,
; .
Вибіркові оцінки асиметрії й ексцесу випадкової величини відповідно дорівнюють:
; .
Размещено на Allbest.ru
Подобные документы
Функція розподілу випадкової величини. Найважливіші закони розподілу дискретних випадкових величин. Властивості функції розподілу. Дискретні і неперервні випадкові величини. Геометричний закон розподілу. Біноміальний розподіл випадкової величини.
реферат [178,2 K], добавлен 26.01.2011Закон розподілення дискретної випадкової величини, подання в аналітичній формі за допомогою функції розподілення ймовірності. Числові характеристики дискретних випадкових величин. Значення критерію збіжності Пірсона. Аналіз оцінок математичного чекання.
курсовая работа [105,2 K], добавлен 09.07.2009Основні поняття теорії ймовірності. Аналіз дискретної випадкової величини, характеристика закону розподілу випадкової величини. Знайомство з властивостями функції розподілу. Графічне та аналітичне відображення законів ймовірності дискретних величин.
реферат [134,7 K], добавлен 27.02.2012Математична обробка ряду рівноточних і нерівноточних вимірів. Оцінка точності функцій виміряних величин. Випадкові величини, їх характеристики і закони розподілу ймовірностей. Елементи математичної статистики. Статистична оцінка параметрів розподілу.
лекция [291,4 K], добавлен 17.11.2008Передумови виникнення та основні етапи розвитку теорії ймовірностей і математичної статистики. Сутність, розробка та цінність роботи Стьюдента. Основні принципи, що лежать в основі клінічних досліджень. Застосування статистичних методів в даній сфері.
контрольная работа [16,7 K], добавлен 27.11.2010Властивості числових характеристик системи випадкових величин. Обчислення кореляційного моменту. Ведення комплексної випадкової величини, характеристичні функції. Види збіжності випадкових величин. Приклади доказів граничних теорем теорії ймовірностей.
реферат [113,9 K], добавлен 12.03.2011Основні поняття математичної статистики. Оцінювання параметрів розподілів. Метод максимальної правдоподібності. Парадокси оцінок математичного сподівання та дисперсії, Байєса, методу найменших квадратів, кореляції, перевірки гіпотез та їх пояснення.
дипломная работа [1,1 M], добавлен 12.08.2010Розподіли системи двох випадкових величин, що однозначно визначається сумісним розподілом ймовірностей, який можна задати матрицею. Інтегральна функція розподілу випадкового вектора. Середньоквадратична регресія. Лінійна кореляція нормальних величин.
реферат [253,5 K], добавлен 13.06.2010Визначення кількості сполучень при дослідженні ймовірностей. Закон розподілу випадкової величини. Функція розподілу, знаходження середнього квадратичного відхилення. Визначення щільності розподілу ймовірностей. Закон неперервної випадкової величини.
контрольная работа [71,3 K], добавлен 13.03.2015Оцінка ймовірності відхилення випадкової величини Х від її математичного сподівання. Знаходження дисперсії випадкової величини за допомогою теореми Бернуллі. Застосування для випадкової величини нерівності Чебишова. Суть центральної граничної теореми.
реферат [88,5 K], добавлен 02.02.2010